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Escribo como un loco para no volverme loco. 

Leonardo Padura 




Com a popularizagao dos computadores, as estatrsticas passaram a fazer parte do vocabulario 
da area da saude. Quem le artigos nessa area ja ouviu falar em testes nao parametricos, fator de 
risco, razao de chances e testes diagnostics. Nao basta, porem, que o profissional de saude tenha 
“ouvido falar” de Bioestatrstica; e preciso que adquira visao adequada sobre o assunto, 
entendendo, por exemplo, o que um programa de computador pode fazer por ele - sem 
expectativas excessivas. 

Este livro e, basicamente, uma continuagao do livro Introdugao a Bioestatistica. Por essa 
razao, tanto pode ser util para quem esta estudando Estatrstica como pode ser util para 
profissionais que atuem como consultores nas diferentes areas de saude. A falta de literatura em 
portugues sobre alguns dos temas tratados aqui tambem pode ser uma motivagao para a leitura. 

Mas escrever um livro nao e tarefa facil. Precisei da ajuda de pessoas diferentes, que me 
ajudaram de maneiras diferentes. Quero, portanto, agradecer a minha amiga Martha Maria 
Mischan, que muito sabe sobre Estatrstica. Ela leu os manuscritos e apontou erros, com maestria 
e cordialidade. Outras pessoas tambem me ajudaram: William Saad Hossne fez a apresentagao da 
obra com a disposigao de quem sempre esteve pronto a me ajudar, Jose Eduardo Corrente 
respondeu as minhas muitas perguntas e Glaucia Melo gentilmente acertou as minhas 
references. Tambem devo agradecimentos a meu filho, Marcio Vieira Hoffmann, que sempre me 
ajudou. 

Mas meus maiores agradecimentos sao para todo o pessoal da Elsevier Editora, pelo apoio 
constante ao meu trabalho. Agradego, ainda, aos muitos professores e colegas que propiciaram o 
ambiente para que eu pudesse escrever. No entanto, um professor e escritor nao existe sem seus 
alunos e seus leitores. Devo, portanto, enorme agradecimento a quem me le. 
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Dados, Variaveis e 
OutrosTermos 



Para muitas pessoas, a palavra Estatistica lembra numeros. No sentido de informaqao numerica, 
as estatrsticas ja fazem parte de nosso dia a dia. Discutimos - com base em informaqoes 
numericas - o aumento da expectativa de vida, a diminuiqao das taxas de natalidade ou a 
preocupaqao das seguradoras de saude com o aumento de casos de obesidade. E lemos, em 
jornais e revistas, que o estresse e fator de risco para o infarto do miocardio ou que a terapia 
com celulas-tronco tern grande probabilidade de sucesso. 

Estatistica nao e, porem, simples coleqao de numeros, embora as medidas ou observaqoes na 
forma numerica sejam sua base. No sentido academico, a Estatistica pode ser dividida em duas 
partes: 

• Estatistica Descritiva, que sao os procedimentos utilizados para organizar a coleta, a 
apuraqao, a classificaqao e a descriqao dos dados. 

• Inferencia Estatistica, que sao os procedimentos atraves dos quais se generaliza o 
conhecimento adquirido em amostras para a populaqao de onde as amostras provieram. 



1.1. DADOS E VARlAVEIS 

Dado e a informagao coletada e registrada, referente a uma variavel. 

Variavel e uma condigao ou caracteristica que descreve uma pessoa, um animal, um lugar, 
um objeto, uma ideia. A variavel pode assumir valores diferentes em diferentes unidades. 

As variaveis - e consequentemente os dados - sao classificadas em dois tipos: 

• Categorizadas (antes chamadas qualitativas). 

• Numericas (antes chamadas quantitativas). 

Variavel categorizada ou qualitativa: seus valores sao expressos em palavras. 

Variavel numerica ou quantitativa: seus valores sao obtidos por medigao ou contagem. 

Exemplo 1.1 

Raga de caes e variavel categorizada (pequines, pastor alemao, fila, boxer etc..) 

Populagao de uma cidade e variavel numerica. 

As variaveis categorizadas ou qualitativas sao classificadas em dois tipos: 

• Nominal. 

• Ordinal. 

Variavel nominal: seus valores se distribuem em categorias mutuamente exclusivas, 
indicadas em qualquer ordem. 

Variavel ordinal: seus valores se distribuem em categorias mutuamente exclusivas que tern 
ordem intrinseca. 


Exemplo 1.2 

O resultado de um teste de gravidez e variavel nominal porque pode ser “positivo” ou “negativo”, mas as possibilidades de 
resultado tambem podem ser verbalizadas em outra ordem: “negativo” ou “positivo”. 

O grau de satisfa^ao de um paciente com a aten^ao recebida do profissional da saude e variavel ordinal: “muito bom”, “bom”, 
“regular”, “ruim”, “pessimo”. A ordem pode ser invertida (“pessimo”, “ruim”, “regular”, “bom”, “muito bom”), mas nao e 
colocada em qualquer ordem. 


As variaveis quantitativas ou numericas sao classificadas em dois tipos: 

• Discreta. 

• Continua. 

Variavel discreta: so pode assumir alguns valores em um dado intervalo. 
Variavel continua: pode assumir qualquer valor em um dado intervalo. 


Exemplo 1.3 





Sao variaveis discretas: numero de filhos, numero de batimentos cardi'acos por minuto, numero de dentes presentes na boca. 
Sao variaveis continuas: peso, tempo de espera numa fila, temperatura corporal. 


A Figura 1.1 resume a classificagao das variaveis. 



Figura 1.1 - Tipos de variaveis. 


Dados referem-se as variaveis, mas sao valores coletados por observagao, medigao, 
questionamento. Cada unidade investigada fornece seus dados. Coletamos dados como, por 
exemplo, a idade de brasileiros, para conhecer a distribuigao dessa variavel. 


Exemplo 1.4 

As informagoes contidas em cedulas de identidade - como nome completo do cidadao, data e local de nascimento - sao variaveis, 
mas em sua cedula de identidade estao seus dados. 



















1.2. CUIDADOS NO REGISTRO DOS DADOS 


1.2.1. Dados nominais e ordinais 

Dados nominais e ordinais sao descritos por palavras, mas podem ser registrados por numeros. 
Esses numeros nao tern, no entanto, significado numerico. Por exemplo, muitas vezes sexo e 
registrado como 1 para masculino e 2 para feminino. Isso nao significa ordem nem valor 
numerico (sexo feminino nao e “segundo sexo”, nem uma mulher vale o dobro de um homem). 

Em algumas areas, e usual, ou ate mesmo convencional, registrar dados ordinais por numeros. 


Exemplo 1.5 

Os tumores sao estadiados de acordo com o grau de desenvolvimento em uma escala numerica, que em geral varia de 0 a IV. Os 
numeros indicam apenas ordem: a Fase IV vem depois da Fase II porque tern pior prognostico, mas a Fase IV nao significa o 
dobro da Fase II. 


Quando as categorias de uma variavel ordinal sao referenciadas por numeros, e preciso que a 
pessoa que faz o registro do dado tenha definiqao clara do significado de cada numero que 
compoe a escala de medida da variavel. 


Exemplo 1.6 

A Organizagao Mundial da Saude (OMS) desenvolveu o Sistema de Medigao da Autonomia Funcional para avaliar a atividade 
funcional das pessoas. A pessoa entrevistada responde a um questionario com 29 perguntas. O entrevistador precisa saber o 
significado de cada numero: 

• 0 = independente; 

• 1 = precisa de supervisao; 

• 2 = precisa de ajuda; 

• 3 = dependente. 

A soma dos pontos nas 29 perguntas e uma medida da atividade funcional da pessoa. 

Na maioria das vezes, porem, as categorias das variaveis ordinais nao sao definidas de 
maneira unica e convencional. E o pesquisador quern define a escala para estabelecer as 
categorias da variavel que estuda. Por exemplo, pode ser definida uma escala de tres pontos para 
grau de satisfaqao: “bom”, “regular”, “ruim”. Em lugar de palavras, o pesquisador tambem pode 
usar figuras, notas ou uma escala visual analogica. 

Figuras: sao usadas para obter respostas de pessoas com pouca escolaridade ou de crianqas, 
mas - para relatar e avaliar os resultados da pesquisa - os pesquisadores transformam as figuras 
em palavras. 









Exemplo 1.7 


Pode-se perguntar a uma crian^a: “Que cara voce faz quando vai ao dentista?” e pedir que ela aponte uma das figuras abaixo: 



Nota: em centros de atendimento, e comum solicitar ao participante de pesquisa que atribua 
uma nota ao que esta sentindo, seja dor, medo, desconforto ou, ate mesmo, uma nota a satisfagao 
com um procedimento. 

Exemplo 1.8 

Pode-se perguntar a um paciente que se submeteu a uma cirurgia estetica: “Em uma escala de 0 a 5, que nota voce daria ao 
resultado da sua cirurgia?” 


Escala visual analogica (EVA): para usar a escala visual analogica, o pesquisador fornece ao 
participante de pesquisa o desenho de um segmento de reta de comprimento conhecido. No 
inicio e no final desse segmento devem estar escritos estados extremos do sentimento que o 
pesquisador pretende medir. Por exemplo, devem estar escritos “pessimo” no inicio do segmento 
e “excelente” no final. O participante da pesquisa marca um “X” na alternativa que mostra o que 
esta sentindo. Depois, o pesquisador mede a distancia do inicio do segmento ate o “X” - e tern 
um mimero. 


Exemplo 1.9 

Para avaliar a dor apos instrumentaqao cirurgica, o dentista pode solicitar a seu paciente que indique o grau de dor que esta 
sentindo em uma escala como a apresentada em seguida: 

Nenhuma dor Dor insuportavel 


Quando se usam figuras, notas e escalas visuais, cada pessoa avalia a si propria. Entao, os 
dados para analise sao valores conferidos por pessoas diferentes avaliando situagoes diferentes. 
A nota 3 para uma pessoa pode nao ter o significado que a mesma nota 3 tern para outra pessoa. 
E preciso cuidado na analise. 

1.2.2. Dados discretos e dados contmuos 

Dados discretos nao podem ser confundidos com dados ordinais. Por exemplo, se alguem 
apresenta uma distribuigao de mulheres segundo o mimero de filhos nascidos vivos (0, 1, 2, 3, 4 
ou mais), esta relatando um dado discreto (mimero de filhos sao contaveis), mas se alguem 
apresenta uma distribuigao de mulheres com cancer de mama segundo o estadiamento do tumor 





(Fases 0, I, II, III e IV), esta relatando um dado ordinal. Pode ser calculado o numero medio de 
filhos por mulher, mas para a analise da distribuigao de estadiamento clrnico de tumores 
malignos deve ser construrda uma distribuigao de frequences. 

Os valores que podem ser assumidos por uma variavel contmua sao limitados pela precisao do 
instrumento de medida. 1 Algumas vezes, porem, e usual registrar dados com poucos decimais. 
Por exemplo, nos estudos com adultos registram-se idades em anos completos, embora a idade 
seja uma variavel contmua (envelhecer e um processo continuo). Somente nos estudos com pre- 
escolares registra-se a idade em meses completos e somente nos estudos com recem-nascidos 
registra-se a idade em dias. 

De qualquer forma, os dados numericos devem ser registrados na forma em que foram obtidos 
- e nao por classes ou categorias. Registre a idade da pessoa - e nao seu grupo de idade. Registre 
o peso, a pressao sangumea, o nivel de colesterol do paciente como foram medidos e so depois, 
se for o caso, converta em classes para analise. Nao ha como recuperar dados contmuos que 
foram registrados em classes. No entanto, como toda regra, esta tambem tern excegao: se a 
variavel coletada e altamente imprecisa, como numero de cigarros fumados por dia, e mais 
sensato anotar os dados apenas por categorias, como: nenhum, de 1 a 5, de 6 a 10, de 10 a 20, 21 
ou mais. 


1.3. DADOS DISCREPANTES, PERDIDOS E CENSURADOS 


Os artigos cientrficos por vezes fazem referenda a dados discrepantes (outliers), dados perdidos 
(missing values) ou dados censurados (censored data). Nesta seqao, e feita breve referenda a 
esses tipos de dados. 

Dado discrepante ou adpico e um valor extremo, que difere muito dos demais dados da 
amostra (por ser muito maior ou muito menor do que os outros). 

E importante saber que dados discrepantes tern influencia consideravel nos resultados dos 
testes parametricos. A inclusao - ou a exclusao - de tais dados tern efeito real sobre a media e a 
variancia e pode, por conta disso, modificar o resultado de um teste estatrstico. Uma estrategia 
razoavel para enfrentar a situaqao e analisar os dados incluindo, depois excluindo, os dados 
discrepantes. Se os resultados forem praticamente iguais, use a analise que inclui os dados 
discrepantes. Se os resultados mudarem muito com a inclusao dos dados discrepantes, procure 
uma explicagao - que possa justificar a inclusao ou a exclusao desses dados na amostra. Outra 
soluqao - proposta neste livro - e o uso de um teste nao parametrico. 

De qualquer forma, saiba que alguns analistas insistem na ideia de que todo valor que se 
distancie mais de tres desvios padrao da media deve ser descartado. Outros calculam a distancia 
interquartrlica e consideram que deve ser descartado todo valor que esteja 1,5 vez a distancia 
interquartrlica acima do terceiro quartil ou abaixo do primeiro quartil. Embora as tecnicas 
estatrsticas possam ser usadas para apontar os dados discrepantes, elas nao devem ser usadas 
para determinar o que fazer com eles. 

De qualquer modo, quando o pesquisador se depara com um dado discrepante, deve verificar 
se houve erro no registro ou na coleta desse dado. Se ficar comprovado que o dado esta errado 
porque houve falha em seu registro ou na coleta, deve ser descartado. Usando essa mesma logica 
- de que falhas no processo de registro ou de coleta justificam o descarte -, tambem deve ser 
retirado da analise todo dado que, embora plausrvel, nao esteja de acordo com criterios 
previamente estabelecidos para a coleta de dados. Por exemplo, se voce estiver entrevistando 
idosos e, nos criterios de inclusao, foi estabelecido nao admitir pessoas com menos de 60 anos, 
descarte dados de pessoas com 59 anos ou menos, mesmo que os dados dessas pessoas sejam 
compatrveis com os demais. 

Dado perdido: e o dado que existe, mas seu valor nao esta registrado. 

Quando as amostras sao grandes, alguns dados podem ser perdidos por acaso. Por exemplo, 
dados de alguns participantes podem se extraviar nos grandes levantamentos epidemiologicos 
sem que isso afete o resultado da pesquisa. 

Nao se pode, porem, considerar casual a perda de dados por razoes associadas a natureza da 
pesquisa. No caso de questionarios, se muitas pessoas nao respondem a determinada pergunta, e 
preciso avaliar e discutir o que aconteceu. A pergunta estava redigida de forma clara? As pessoas 


nao queriam - por algum motivo - responder a pergunta? Qual seria esse motivo? Encontrar o 
que motivou a perda de dados ou, pelo menos, lanqar uma hipotese sobre isso e muito 
importante. 

Em ensaios clmicos, dados podem ser perdidos devido as proprias exigencias da pesquisa. Por 
exemplo, se os participantes de pesquisa devem voltar com frequencia ao centro de pesquisa para 
avaliaqoes, dados de varios deles podem comeqar a faltar a partir de determinado momento - 
simplesmente porque eles se cansaram de cooperar. 

Por outro lado, e preciso cuidado com as informaqoes registradas apenas como “Sim” e “Nao” 
quando se usam dados de arquivos, prontuarios e fichas clmicas. Existe certa tendencia a achar 
que dado nao registrado significa “Nao” em vez de considerar que o dado foi perdido. Entao, se 
voce estiver procurando informaqao sobre a presenqa de determinado sintoma, nao entenda que 
ausencia de registro significa ausencia do sintoma. Procure saber o que realmente aconteceu. 

Ainda, muitas vezes as datas sao registradas apenas parcialmente. Por exemplo, escreve-se 
como data da primeira consulta: 08/1999. E razoavel considerar que essa consulta foi no dia 15, 
so porque esse dia fica no meio do rues, em lugar de considerar que o dado foi perdido. Mas e 
preciso cuidado com outras datas que possam constar da ficha clinica e que tornem a data 
arbitrada impossrvel. Se a data de morte foi, por exemplo, 13/08/1999, ninguem conseguira 
explicar a consulta. 

Finalmente, e preciso cuidado quando se coletam dados para, a partir deles, calcular outra 
variavel. Se voce precisa calcular o rndice de massa corporal (IMC) de seus pacientes, e melhor 
verificar se todos os dados de peso e altura foram registrados antes de comeqar os calculos. 
Retire da amostra todos os participantes para os quais faltam informaqoes ou encontre a 
informaqao perdida. 

Dado censurado: e um dado que existe, mas nao sabemos seu valor, embora saibamos que 
esse valor esta alem ou aquem de certo limite. 2 E comum aparecerem dados censurados nas 
seguintes situaqoes: 

1. Em ensaios clmicos de longo prazo, em que o resultado de interesse e o tempo de 
sobrevivencia. E claro que o ensaio deve terminar em certo momento. O tempo de 
sobrevivencia dos pacientes que continuaram vivos ao termino do ensaio e um dado 
censurado. 

2. Nas medidas obtidas por meio de aparelhos que tern limite minimo para as mediqoes. 
Nesses casos, o valor real de algumas unidades pode, eventualmente, estar abaixo do limite 
minimo do aparelho. Esses dados sao ditos censurados porque se sabe, apenas, que seus 
valores reais estao abaixo desse limite. 

3. Nos ensaios em que a variavel em analise e o tempo decorrido entre o inrcio das 
observaqoes e determinado desfecho. Se esse desfecho nao ocorre no periodo de tempo 
estabelecido para a execugao do ensaio para algumas unidades, os dados dessas unidades 


sao chamados de censurados. 


Exemplo 1.10 

Imagine que um pesquisador produziu inflamagao em uma das patas de ratos de laboratorio para depois verificar o tempo de 
recuperagao deles quando tratados com diferentes anti-inflamatorios. Se o pesquisador medir as patas dos ratos no instante em 
que produziu a inflama^ao, 24 e 48 horas depois, alguns animais poderao permanecer com as patas inflamadas depois das 48 
horas determinadas pelo protocolo para coleta de dados. Esses dados sao ditos censurados porque, no periodo de tempo 
estabelecido para observagao, o desfecho esperado nao ocorreu. 




1.4. DADOS UNIVARIADOS E DADOS BIVARIADOS 


Os dados estatisticos sao, muitas vezes, designados conforme o numero de variaveis envolvidas 
na pesquisa. 

Dados univariados: se, na pesquisa, for coletada uma unica variavel, dizemos que os dados 
sao univariados. Por exemplo, se um dentista levantar o numero de caries em criangas da pre- 
escola, estara trabalhando com uma unica variavel. Seus dados serao, portanto, univariados. 

Dados bivariados: quando, na pesquisa, sao coletadas duas variaveis com a finalidade de 
estabelecer associates entre elas, dizemos que os dados sao bivariados. Por exemplo, se um 
fisioterapeuta levantar dados de peso e altura de adolescentes do ultimo ano do curso 
fundamental para calcular o indice de massa corporal, estara trabalhando com duas variaveis. 
Seus dados serao, portanto, bivariados. 


RESUMO E OBJETIVO DO CAPITULO 

Lido este Capitulo, voce devera saber definir e exemplificar: 

1. dado e variavel 

2. variavel nominal 

3. variavel ordinal 

4. variavel discreta 

5. variavel numerica 

6. dados perdidos 

7. dados discrepantes 

8. dados censurados 

9. dados univariados e bivariados 


1 VIEIRA, S. Erros sistematicos e aleatorios nas medigoes. Disponlvel em: https://www.blogger.com/blogger. 

2 Foi definida aqui a censura tipo I, mas existem outros tipos de censura. Veja, por exemplo: COX, D.R.; OAKES, D. Analysis of 

Survival Data. Londres: Chapmann & Hall, 1984. 




uassirique as variaveis como nommais, orainais, aiscretas ou conunuas: aj aensiaaae ossea; d ) marcas comerciais ae um 
mesmo analgesico; c) comprimento de implantes; d) gosto (doce ou amargo); e) sexo; f) numero de dentes permanentes 
irrompidos em uma crianga; g) numero de pacientes atendidos por dia em um consultorio; h) altura da face; i) qualidade 
percebida do atendimento (bom, normal, ruim). 

1.5.2. a) De um exemplo de situagao em que o pesquisador pode atribuir nota ao que observa. b) De um exemplo em que o 

pesquisador obtem dados univariados. 

1.5.3. Para mostrar que o uso de vocabulario especializado dificulta o entendimento do Termo de Consentimento Livre e 

Esclarecido (TCLE), 3 um pesquisador organizou um questionario para ser respondido pelos atendentes de um hospital. 
Havia questoes sobre idade, sexo, escolaridade, doengas presentes, pressao arterial, medicamentos usados, alergia a 
aspirina e terminava perguntando se a pessoa estaria disposta a participar de um experimento para testar “a agao 
analgesica do acido acetilsalicilico para eventuais cefaleias”. Identifique os tipos de dados. 

1.5.4. Sao dadas as notas de 16 alunos em uma prova. Voce ve algum valor discrepante? 

10; 9; 7; 8; 7; 9; 10; 7; 8; 8; 8; 9; 10; 2; 7; 9 

1.5.5. Voce pode solicitar as maes de criangas de 4 e 5 anos de idade que avaliem o medo que seus filhos tern de ir ao dentista 

usando uma escala visual anaiogica? Como isso pode ser planejado? Seria mais facil usar outra forma de medir? 

1.5.6. Reveja o exerci'cio 1.5.3. Voce acha que a ultima questao foi escrita de maneira adequada para que as atendentes de 

enfermagem possam responder? Ou, ao contrario, foi escrita para obter o numero de nao respondentes e/ou respostas 
inadequadas? 

1.5.7. Para estudar o tempo de latencia de um sonffero usando ratos de laboratorio, um pesquisador administrou o sonffero a 10 

ratos e registrou o tempo que cada um demorou para dormir: 2 demoraram meio minuto para dormir, 4 demoraram 1 
minuto, 3 demoraram 1,5 minuto e 1 nao dormiu durante o tempo estabelecido para obter os resultados do estudo. Algum 
dado foi censurado? 

1.5.8. Um professor de educagao fisica levantou dados dos alunos de uma escola publica: sexo, idade, peso, estatura, doengas, 

tratamento medico (em tratamento ou nao) e esporte que pratica. Identifique o tipo de cada variavel estudada. 

1.5.9. Um homem e atendido na emergencia de um hospital com queixa de dor no peito. O medico que o atende diagnostica 

angina e a classifica como severa. Essa classificagao “severa” caracteriza uma variavel: 

a) numerica 

b) nominal 

c) ordinal 

d) quantitativa 

1.5.10. Responda: falso ou verdadeiro? “Um dos tratamentos de um ensaio clinico conduzido para comparar cinco tratamentos 
causa mais desconforto do que os outros. Provavelmente, esse tratamento tera mais dados censurados”. 


3 Veja a Resolugao CNS ns 196/1996 do Conselho Nacional de Saude do Ministerio da Saude. 



• • • 



Testes Estatisticos 



A leitura sistematica das revistas da area de saude deixa evidente que os pesquisadores, 
embora trabalhem com amostras, generalizam seus achados para toda a populagao de onde a 
amostra foi retirada. 4 E, para generalizar seus achados, os pesquisadores aplicam testes 
estatisticos. 

Vamos apresentar aqui a logica desses testes por meio de um exemplo historico. Em meados 
do seculo XIX, o cirurgiao Joseph Lister (1827-1912), que estudava os trabalhos de Pasteur, 
percebeu que o estudo das bacterias e a pratica da cimrgia eram ciencias interdependentes. 5 
Sendo isso verdade - Lister ponderou -, a assepsia das salas cirurgicas deveria aumentar as taxas 
de sobrevivencia nos pos-operatorios. 

Para verificar essa hipotese, Lister fez um ensaio. Distribuiu 75 pacientes que iriam ser 
submetidos a uma cirurgia em dois grupos: o grupo controle, que foi submetido a cirurgia em 
salas nas condiqoes usuais do hospital na epoca, 6 e o grupo com intervenqao, que foi submetido a 
cirurgia em salas onde a assepsia havia sido feita com acido fenico. 

Lister tinha sua hipotese: a assepsia das salas cirurgicas deveria aumentar a taxa de 
sobrevivencia nos pos-operatorios. Outros cirurgioes tinham, porem, outra hipotese: a assepsia 
das salas cirurgicas nao teria qualquer efeito sobre as taxas de sobrevivencia nos pos-operatorios. 
Os resultados do ensaio de Lister estao apresentados na Figura 2.1. 



Figura 2.1 - Resultados do experimento de Lister. 


A diferenqa das taxas de sobrevivencia entre os dois grupos e grande. Veja: sobreviveram 34 
dos 40 pacientes do grupo com intervenqao. A taxa de sobrevivencia e 

34 

— x 100 = 85,0% 

40 

Sobreviveram 19 dos 35 pacientes do grupo controle. A taxa de sobrevivencia e 


19 

— x 100 = 54,3% 









A diferenqa entre grupos e 


85,0 - 54,3 = 30,7% 


Sera que uma diferenqa entre grupos tao grande como essa foi suficiente para convencer os 
medicos da epoca da necessidade de assepsia? Nao, como mostra a historia da Medicina, mas 
como essa questao seria tratada hoje? Aplicando um teste estatrstico. 



2.1. DECIDINDO SOBRE AS HIPOTESES 


Vamos mostrar a construgao de um teste estatistico usando o ensaio de Lister. Parece razoavel 
considerar que ha duas explicagoes possiveis para a diferenga encontrada entre as taxas de 
sobrevivencia: 

1. Acaso. A diferenga observada entre grupos seria obra do acaso. 

2. Assepsia. A diferenga observada entre grupos seria devida a intervengao (assepsia da sala 
cirurgica). 

Para decidir por uma das explicagoes, toda revista cientifica julga, hoje, mandatorio aplicar 
um teste estatistico. Veja como se constroi o teste. 

1. Comece considerando que a intervengao nao tem efeito. Esta e a hipotese da nulidade 7 
(“nulidade” porque diz que o efeito da intervengao e nulo). Indica-se por H 0 (le-se aga 
zero). No exemplo, a hipotese e a de que a assepsia nao tem efeito, ou seja, as taxas de 
sobrevivencia sao iguais nos dois grupos. Escreve-se: 

H 0 : a intervengao nao tem efeito. 

2. Em seguida, considere a nova proposta: a intervengao tem efeito. Essa e a hipotese 
alternativa. Indica-se por H x (le-se aga um). No exemplo, o pesquisador considerava que 
as taxas de sobrevivencia sao maiores no grupo que recebeu a intervengao. Escreve-se: 

Hp a intervengao tem efeito positivo. 

3. Agora, pergunte-se: se a hipotese da nulidade for verdadeira, e provavel obter uma 
diferenga entre taxas de sobrevivencia tao grande quanto ou maior do que a que Lister 
obteve? 

4. Calcule a probabilidade de ocorrer diferenga entre taxas de sobrevivencia tao grande ou 
maior do que a que Lister obteve, considerando verdadeira a hipotese da nulidade. Essa 
probabilidade 8 denomina-se p-valor. 

5. Olhe o p-valor e admita: 

a) p-valor pequeno significa que e pouco provavel obter uma diferenga tao grande ou 
maior do que a observada se a hipotese da nulidade for verdadeira. Entao, rejeite a 
hipotese da nulidade. 

b) p-valor grande significa que e provavel obter diferenga tao grande ou maior do que a 
observada se a hipotese da nulidade for verdadeira. Nesse caso, nao rejeite a hipotese 
da nulidade. 

Quao pequeno deve ser o p-valor para que voce decida rejeitar a hipotese da nulidade? Por 


tradigao (nao ha nenhuma razao teorica para isso), o p-valor e considerado pequeno quando: 

a) E menor do que 0,05. Escreve-se p < 0,05. Diz-se, entao, que o resultado e significante e 
a hipotese da nulidade e rejeitada. Veja a Figura 2.2. Ou, entao, 

b) E menor do que 0,01. Escreve-se p < 0,01. Diz-se que o resultado e altamente 
significante. A hipotese da nulidade e rejeitada. 


Pergunta: intervengao tem efeito? 


I 




Hipoteses 




I 



H,: tem 
efeito 


H 0 : nao 
tem efeito 


Figura 2.2 - Tomada de decisao: significante ou nao significante? 


Exemplo 2.1 

Lister obteve os dados apresentados na Figura 2.1 . Sob a hipotese de que a assepsia nao tem efeito sobre a taxa de sobrevivencia 
dos operados (hipotese da nulidade), a probabilidade de ocorrer uma diferenga igual ou maior do que a obtida por Lister e p-valor 
= 0,0024. Conclui-se entao que a intervengao (assepsia) tem efeito. 9 


Sobrevivencia de operados em salas cirurgicas com e sem assepsia 


Sobrevivencia 

Sim 

Assepsia na sala cirurgica 

Nao 

Total 

Sim 

34 


19 

53 

Nao 

6 


16 

22 

Total 

40 


35 

75 

Taxa de sobrevivencia 

85,00% 


54,30% 


p-valor 


0,0024 < 0,05 




Fonte: WINSLOW, C. The Conquest of Epidemic Disease. Princeton: Princeton University Press, 1943. p. 303. Apud ALIAGA, M.; 
GUNDERSON, B. Interactive Statistics. 2 nd ed. New Jersey: Prentice Hall, 2003. p. 673. 















2.2. MEDINDO A INCERTEZA 


2.2.1. Calculando o p-valor 

Com base nos dados de uma amostra, os pesquisadores calculam o p-valor, que e a probabilidade 
de obter uma diferenga tao grande ou maior do que a observada se o tratamento nao tiver efeito. 

Se o p-valor for pequeno, os pesquisadores fazem uma inferencia estatistica: concluem que o 
tratamento tern efeito na populagao de onde retiraram a amostra. No entanto, os pesquisadores 
nao tern 100% de certeza de que essa conclusao esta correta. Eles apenas sabem que a 
probabilidade de essa conclusao estar errada e muito pequena (e o p-valor). 

Calcular o p-valor e dificil, mas hoje se usam computadores e programas prontos para fazer os 
calculos. Antes da popularizagao dos computadores, usavam-se tabelas para determinar a 
significancia dos resultados - e essas tabelas ainda sao fornecidas nos livros de Estatistica e na 
internet. 

Nao pense, porem, que ficou facil aplicar um teste estatrstico e obter o p-valor. E preciso, 
primeiramente, escolher o teste que sera utilizado em fungao das hipoteses que se quer testar. 
Depois, e preciso verificar se a variavel em analise atende as pressuposigoes exigidas para a 
aplicagao do teste. 10 

E tenha muito cuidado na interpretagao do p-valor, 11 que nao e intuitiva porque usa a 
contradigao: a hipotese colocada em teste afirma o contrario do que o pesquisador acha que e (ou 
gostaria que fosse) verdadeiro. Talvez por isso o p-valor seja, muitas vezes, mal interpretado. 
Para evitar que isso acontega com voce, 12 tenha sempre em mente que: 

p-valor e a probabilidade de obter uma diferenga entre grupos tao grande ou maior 
do que a obtida quando essa diferenga nao existe. 


Em outras palavras: 

p-valor e a probabilidade de o pesquisador estar errado quando diz que os grupos 

em comparagao sao diferentes. 

Veja bem: o p-valor nada diz sobre o fato de H 0 ser ou nao ser verdadeiro. Informa, apenas, 
que a decisao de rejeitar H 0 pode estar errada. No entanto, e o pesquisador quern deve resolver - 
juntando todas as informagoes que tern ao p-valor que obteve - se a hipotese da nulidade parece 
improvavel o bastante para que ele corra o risco de dizer que deve ser rejeitada. 


2.2.2. Apresentando o nivel de significancia 


Para aplicar um teste estatistico, o pesquisador comega levantando a hipotese de que o tratamento 
nao tern efeito. E a hipotese da nulidade, que se indica por H 0 (le-se aga-zero). No entanto, o 
pesquisador acredita no contrario: acha que o novo tratamento tem efeito. Esta e a hipotese 
alternativa - que se indica por EQ (le-se aga-um). 

O pesquisador faz o teste estatistico, que fornece o p-valor. Se o p-valor for pequeno - 
tradicionalmente, menor do que 0,05 -, o pesquisador conclui que o tratamento tem efeito na 
populagao de onde a amostra foi retirada. O pesquisador sabe que o p-valor e a probabilidade de 
essa conclusao estar errada. 

Em teoria, o pesquisador deve estabelecer a probabilidade de errar quando diz que existe 
diferenga entre grupos - e essa diferenga nao existe - antes de proceder ao teste. Essa 
probabilidade e o mvel de significance do teste, que se indica por ~ (le-se alfa). Quando voce le 
p < 0,05, saiba que a hipotese da nulidade (de que o tratamento nao tem efeito) foi rejeitada no 
mvel de significance de 5%. 

Teoricamente, a probabilidade de rejeitar H 0 quando H 0 e verdadeiro (o mvel de significance 
~) deve ser estabelecida antes de o teste ser aplicado. 

Exemplo 2.2 

Lister considerou que a assepsia das salas cirurgicas aumenta as taxas de sobrevivencia nos pos-operatorios. Conduziu, entao, um 
ensaio para mostrar isso. Hoje em dia, na publica^ao dessa pesquisa, obrigatoriamente estariam descritos: 

• H 0 : Na populagao, as taxas de sobrevivencia sao iguais nos dois grupos: tratado (com assepsia) e controle (sem assepsia). 

• Hp Na populagao, a taxa de sobrevivencia no grupo tratado (com assepsia) e maior do que a taxa de sobrevivencia no grupo 

controle (sem assepsia). 

• Nivel de significancia: ~ = 0,05. 

Obtidos os dados, teria sido feito um teste estatistico para comparar as taxas de sobrevivencia. Sob H 0 , a probabilidade de ocorrer 
uma diferenga igual ou maior do que a obtida por Lister e p-valor = 0,0024. Como o p-valor e menor do que o nivel de 
significancia adotado, isto e, p < 0,05, a conclusao e de que o ensaio trouxe evidencia de que a assepsia nas salas de cirurgia 
aumenta a taxa de sobrevivencia em cirurgias de amputagao (~ = 5%). 


2.2.3. Avaliando o poder do teste 

Poder 13 do teste estatistico e a probabilidade de o teste rejeitar a hipotese da nulidade quando a 
hipotese da nulidade e falsa. 

Em outras palavras: 

Poder do teste estatistico e a probabilidade de o teste detectar uma diferenga que realmente 
existe na populagao. 


Exemplo 2.3 

Imagine que voce esta conduzindo uma serie de ensaios com uma droga eficaz. Estao em comparaqao dois grupos: o tratado (que 
recebe a droga) e o controle (que nao recebe a droga). Se voce aplicar um teste estatistico com poder de 0,90 para comparar 





grupos, deve esperar resultados estatisticamente significantes em 90% das vezes. Em 10% dos casos, nao deve esperar resultados 
estatisticamente significantes. Entao, poder do teste e a probabilidade de encontrar a diferenqa entre os dois grupos quando essa 
probabilidade realmente existe. 

Varios fatores afetam o poder de um teste estatistico. Vamos mencionar alguns, imaginando 
que voce esteja aplicando sempre o mesmo teste. 14 

• O poder do teste depende do tamanho da diferenqa : os testes estatisticos tern mais poder 
para detectar uma diferenqa de 40% do que uma diferenqa de 2%. 

• O poder do teste depende do nivel de significancia adotado. No nivel de significance de 
5%, a hipotese da nulidade sera rejeitada se p < 0,05. Diminuir o mvel de significancia faz 
diminuir a probabilidade de rejeitar a hipotese da nulidade - seja ou nao verdadeira - e, 
consequentemente, diminui o poder do teste. 

• O poder do teste depende do tamanho da amostra. A confianqa na informaqao aumenta 
quando aumenta a quantidade de dados. 

IMPORT ANTE: Quando se calcula o tamanho da amostra, e comum adotar - embora nao haja 
qualquer justificativa teorica para isso - nivel de significancia de 5% e poder de teste de 80%. 
Isso significa que voce admite ate 5% de probabilidade de estar errado ao dizer que os grupos 
sao diferentes e 80% de probabilidade de detectar uma diferenqa que realmente existe. 


2.3. TESTES UNILATERAL E BILATERAIS 


Para aplicar um teste de hipoteses e preciso, primeiramente, decidir se o teste sera unilateral ou 
bilateral. 

Um teste e unilateral quando a hipotese da nulidade so pode ser rejeitada se a diferenga entre 
grupos tiver o sentido especificado pelo pesquisador (p. ex., o pesquisador diz, no projeto, que 
espera efeito positivo do novo tratamento). 

Exemplo 2.4 

Foi apresentado o resultado do teste estatistico para os dados de Lister. Veja as hipoteses: 

• H 0 : assepsia nao tem efeito sobre a taxa de sobrevivencia dos operados. 

• Hp assepsia aumenta a taxa de sobrevivencia dos operados. 

O teste unilateral se justifica: e razoavel verificar se os dados apresentados por Lister ja mostravam o que se sabe hoje. 


Um teste e bilateral quando a hipotese da nulidade e rejeitada qualquer que seja o sentido (o 
sinal) da diferenga entre grupos. 


Exemplo 2.5 

Dez ratos machos adultos, criados em laboratorio, foram separados aleatoriamente em dois grupos: o grupo controle, que recebeu 
a ragao normalmente usada no laboratorio, e o grupo tratado, que recebeu uma ragao experimental. Como nao se sabe o sentido 
da diferenga, isto e, se a nova ragao vai aumentar ou diminuir o peso dos ratos, parece razoavel fazer um teste bilateral: 

• H 0 : em media, o peso dos ratos tratados com a nova ragao e igual ao peso dos ratos tratados com a ragao conhecida. 

• Hp a media dos pesos dos ratos que receberam a nova ragao e estatisticamente diferente da media dos ratos tratados com a 

ragao conhecida. 


Os estatisticos em geral discordam da ideia de testes unilaterais, que seriam validos somente 
quando fosse impossivel ocorrer uma diferenga em sentido contrario ao esperado. Veja as razoes 
por que eles discordam da aplicagao de testes unilaterais: 

1. Os testes bilaterais sao mais seguros - porque o tratamento pode dar resultado contrario ao 
esperado. 

2. Os testes bilaterais sao mais conservadores, isto e, tem menor probabilidade de rejeitar H 0 . 
Como grande parte dos experimentos nao satisfaz as exigencias metodologicas nem as 
pressuposigoes exigidas para aplicar os testes estatisticos, e melhor trabalhar com testes 
que tem menor probabilidade de detectar significance. 

Alguns pesquisadores preferem o teste unilateral, que e referido como teste de superioridade. 
O argumento em favor dos testes unilaterais e o de que uma boa revisao da literatura mostra o 
sentido da diferenqa. No entanto, a situaqao sera constrangedora se a diferenqa for significante, 
mas em sentido contrario ao esperado. 







2.4. TESTES PARAMETRICOS E NAO PARAMETRICOS 


Na area medica, sao muito usados o teste t de Student, 15 a analise de variancia e o teste de 
Tukey. 16 Tais testes exigem, para sua aplicagao, que a variavel em analise seja numerica e as 
hipoteses sejam feitas sobre parametros, como medias e variancias. 17 Dal o nome: testes 
parametricos. Por exemplo, para comparar a altura de meninos e meninas da mesma idade, o 
pesquisador pode optar por testes parametricos - e testar as diferengas de medias (pelo teste t de 
Student) e de variancias (pelo teste F de Snedecor). 

Os testes parametricos tern, ainda, outras exigencias. Por exemplo, o teste t exige pressupor 
que a variavel em analise tenha distribuigao normal ou, pelo menos, simetrica. O teste F exige, 
alem da pressuposigao de variavel com distribuigao normal ou aproximadamente normal, ou pelo 
menos simetrica, a pressuposigao de homocedasticia (homogeneidade de variancias, ou seja, a 
mesma variabilidade dentro de grupos). 

E o que faz o pesquisador quando verifica que a variavel que estuda nao atende as 
pressuposigoes exigidas para procedimento de um teste parametrico? Aplica um teste nao 
parametrico. Esses testes nao exigem que a variavel em analise seja numerica e nao exigem 
pressuposigao a respeito da distribuigao da variavel. Nao pense, porem, que pode “substituir” um 
teste parametrico por um nao parametrico: as hipoteses sao diferentes. Quando voce aplica um 
teste t de Student (parametrico), a hipotese da nulidade e de que as medias populacionais sao 
iguais. E quando voce aplica um teste de Mann-Whitney (nao parametrico), a hipotese da 
nulidade e de que as distributes sao iguais. 18 


Exemplo 2.6 

Imagine que um pesquisador quer verificar se a dipirona e mais eficaz do que o paracetamol no controle da dor apos determinada 
interven^ao odontologica. A intensidade da dor pode ser registrada por meio de notas, atribuindo valor 0 para nenhuma dor e 
valor 5 para dor intensa. Como a intensidade de dor e variavel ordinal, nao tem sentido calcular medias e, portanto, nao tern 
sentido aplicar um teste parametrico. O pesquisador deve buscar um teste nao parametrico. 

A logica dos testes nao parametricos e simples e aplica-los e bem mais facil do que aplicar 
seus equivalentes parametricos. No entanto, como tudo na vida tem um prego, voce nao vai se 
surpreender com o fato de os testes nao parametricos terem algumas desvantagens: 

• Os testes parametricos sao mais poderosos, ou seja, tem maior probabilidade de rejeitar a 
hipotese da nulidade quando essa hipotese e falsa. 

• Os testes parametricos sao bastante robustos, ou seja, pequenas transgressoes as 
pressuposigoes exigidas nao invalidam os resultados - principalmente se as amostras forem 
de tamanho grande ou moderado. 

Portanto, para a analise de dados de variaveis com distribuigao aproximadamente normal 
obtidas de grandes amostras, a melhor opgao ainda e um teste parametrico, mais poderoso - 



mesmo que algumas pressuposigoes nao estejam totalmente satisfeitas. Se voce optar por um 
teste nao parametrico, estara optando por um teste com menos poder. 

De qualquer forma, diante de um problema real de pesquisa, voce precisa se decidir por um 
teste parametrico ou por um teste nao parametrico. Aplique um teste parametrico se as seguintes 
afirmativas forem verdadeiras: 

1. Dados quantitativos. 

2. As pressuposigoes exigidas para a aplicagao do teste escolhido estao satisfeitas ou sao 
pequenas as transgressoes. 

3. Amostra e de tamanho grande ou, pelo menos, moderado. 

Aplique um teste nao parametrico quando estiver diante de uma das seguintes situagoes: 

1. Dados qualitativos. 

2. As pressuposigoes exigidas para a aplicagao de testes parametricos nao estao satisfeitas. 

3. A amostra e pequena. 

4. Existem dados discrepantes ou censurados, que podem tornar mais indicado calcular 
medianas - e nao as medias. 

2.4.1. Algumas indicates 

Testes para comparar dois grupos independentes: 

• Para a analise de variavel numerica com distribuigao normal ou, pelo menos, simetrica e 
amostra grande (maior do que 30), aplique um teste parametrico: o teste t de Student. 19 

• Para a analise de variavel ordinal ou de variavel numerica com distribuigao nao simetrica 
e/ou amostra muito pequena, aplique teste nao parametrico: o teste de Mann-Whitney ou o 
teste da mediana, que serao tratados no Caprtulo 3 deste livro. 

• Para a analise de variavel nominal, use o teste de X 2 de Pearson ou o teste exato de Fisher, 
que serao tratados no Caprtulo 5 deste livro. 

Testes para comparar dois grupos dependentes: 

• Para a analise de variavel numerica com distribuigao normal ou, pelo menos, simetrica e/ou 
uma amostra bastante grande, aplique um teste parametrico: o teste t de Student para 
amostras pareadas. 20 

• Para a analise de variavel ordinal ou de variavel numerica com distribuigao nao simetrica 
e/ou amostra muito pequena, aplique um teste nao parametrico: o teste de Wilcoxon ou o 
teste do sinal, que serao tratados no Caprtulo 4 deste livro. 

• Para a analise de variavel nominal, use o teste de X 2 de Mc-Nemar, 21 tratado no Caprtulo 5 
deste livro. 

Testes para comparar mais de dois grupos independentes: 

• Se a variavel for numerica e tiver distribuigao normal ou aproximadamente normal, ou tiver 


pelo menos distribuigao simetrica e a amostra for bastante grande, faga uma analise de 
variancia 22 . 

• Se a variavel for ordinal ou numerica, mas a distribuigao nao for simetrica e/ou a amostra for 
pequena, aplique um teste nao parametrico: o teste de Kruskal-Wallis ou o teste da mediana, 
mostrados no Capitulo 4 deste livro. 

Testes para comparar mats de dois grupos dependentes: 

• Se a variavel for numerica e tiver distribuigao normal ou aproximadamente normal, ou tiver 
pelo menos distribuigao simetrica e a amostra for bastante grande, faga uma analise de 
variancia. 23 

• Se a variavel for ordinal ou numerica, mas a distribuigao nao for simetrica e/ou a amostra for 
pequena, aplique um teste nao parametrico: o teste de Friedman, que veremos no Capitulo 4 
deste livro. 


RESUMO E OBJETIVO DO CAPITULO 


Neste capitulo foi apresentada a logica de um teste estatistico. Sao definidos p-valor, testes 
unilaterais e bilaterais, testes parametricos e nao parametricos. Portanto, uma vez lido este 
capitulo, voce devera saber o que significam: 

1. Hipoteses estatlsticas. 

2. p-valor e nrvel de significancia. 

3. Poder do teste. 

4. Teste unilateral. 

5. Teste bilateral. 

6. Testes parametricos e nao parametricos. 


4 Para estudar amostragem, veja: VIEIRA, S. Introdugao a Bioestatistica. 5. ed. Rio de Janeiro: Elsevier, 2016. 

5 DE PAOLLO, C.; PASTEUR, Lister: a chronicle of scientific dependence. The Victorian Web: Literature, History and Culture 

in the age of Victoria. Disponivel em: http://www.victorianweb.org/science/health/depaolo.html. Acesso em 23 de outubro de 
2017. 

6 Meados do seculo XIX. 

7 A maioria dos estatisticos brasileiros diz “hipotese nula”, traduzindo assim, de maneira a meu ver equivocada, a expressao 

inglesa null hypothesis. 

8 E dificil calcular essa probabilidade, mas esse calculo e feito em computador. 

9 Foi feito um teste unilateral para comparar proporgoes. 

18 Nos proximos capitulos, veremos a indicagao de varios testes e as formulas de calculo. Usaremos tabelas disponiveis no final 
deste livro e mostraremos exemplos de resultados obtidos por meio de programas para computador. 

11 Esta argumentagao esta totalmente baseada em Motulsky, H. Intuitive Statistics. New York: Oxford University Press, 1995. 

12 Glantz, S. A. Primer of Biostatistics. 2 nd ed. New York: McGraw, 1987. p. 97. 

13 Alguns autores dizem potencia do teste (tradugao de power of a statistical test). 

14 Alguns testes tern mais poder do que outros quando aplicados ao mesmo conjunto de dados. 

15 Veja, por exemplo: VIEIRA, S. Introdugao a Bioestatistica. 5. ed. Rio de Janeiro: Campus-Elsevier, 2016. 

16 Veja, por exemplo: VIEIRA, S. Analise de variancia. Sao Paulo: Atlas. E-book. 

17 Veja, por exemplo: VIEIRA, S. Introdugao a Bioestatistica. 5. ed. Rio de Janeiro: Elsevier, 2016. 

18 Veja a segao 5.2 do Capitulo 5 deste livro. 

19 Veja o procedimento para o teste t de Student em VIEIRA, S. Introdugao a Bioestatistica. 5. ed. Rio de Janeiro: Elsevier, 2016. 
Capitulo 13. 

29 Id., ibid. 

21 Veja o Capitulo 5 deste livro. 

22 Veja o procedimento para analise de variancia em VIEIRA, S. Analise de variancia. Sao Paulo: Atlas, 2006. 


23 Id., ibid. 




z.a.i. cmnstrua as mpoteses no caso ae pesquisa com o ODjeuvo ae: aj vermcar se uma nova aroga e memor ao que a iraaicionai; 
b) verificar se determinada dieta aumenta a longevidade; c) verificar se um produto e canceri'geno; d) verificar se uma 
vitamina aumenta o desempenho de atletas. 

2.5.2. Para comparar a prevalencia de alcoolismo entre homens e mulheres residentes do Rio de Janeiro, foram Ievantados os 
dados apresentados na Tabela 2.2. Construa as hipoteses. Foi feito o teste estatistico denominado qui-quadrado. O p-valor 
e 0,0004. O que voce conclui? 


Prevalencia de alcoolismo segundo o sexo 


Sexo 


Alcoolismo 


Total 


Sim 


Nao 


Masculino 

29 


559 

588 

Feminino 

15 


856 

871 

Total 

44 


1.415 

1.459 


Fonte: ALMEIDA, LM, COUTINHO, ESF. Prevalencia de consumo de bebidas alcoolicas e de alcoolismo em uma regiao metropolitana do Brasil. 
Rev Saude Publica 27 (1), 1993. 


2.5.3. Um pesquisador pretende conduzir um experimento para testar uma hipotese 24 . Se resolver duplicar o tamanho da amostra, 

qual dos seguintes itens ira aumentar? 

a) O poder do teste. 

b) O efeito do tratamento. 

c) A probabilidade de erro Tipo II. 

Escolha a resposta: 

1. O poder do teste. 

2. O efeito do tratamento. 

3. A probabilidade de erro Tipo II. 

4. Todos os itens Iistados. 

5. Nenhuma das alternativas listadas. 

2.5.4. Para verificar se meninos e meninas da mesma idade tern igual velocidade de Ieitura e igual capacidade de interpretagao de 

textos, um pesquisador pediu a um grupo de criangas que lessem determinada poesia. Para cada crianga, cronometrou o 
tempo de Ieitura e atribuiu um conceito para medir a capacidade de interpretagao. Voce aplicaria um teste parametrico 
para analisar qual das variaveis? 

2.5.5. Voce quer testar a hipotese de que uma moeda e bem balanceada. Quais sao as hipoteses em teste? Voce resolve jogar a 

moeda seis vezes e dizer que nao e bem balanceada se aparecerem seis caras. Um estatistico calcula que a probabilidade 
de isso acontecer, quando a moeda e bem balanceada, 25 e 

-x—x—x—x-x—= 0,015625 
2 2 2 2 2 2 


Qual e o p-valor? 


2.5.6. Dos 100 pacientes submetidos a determinada cirurgia, oito vieram a obito. Que populagao voce definiria para essa 


estatistica? 


2.5.7. Poder do teste significa: 26 

a) Nao rejeitar H 0 quando H 0 e verdadeira. 

b) Nao rejeitar H 0 quando H 0 e falsa. 

c) Nao rejeitar H 0 independentemente de H 0 ser falsa ou verdadeira. 

d) Rejeitar H 0 quando H 0 e verdadeira. 

e) Rejeitar H 0 quando H 0 e falsa. 

2.5.8. Foi feito um ensaio para comparar o efeito analgesico de duas drogas, A e B, e aplicado um teste estatfstico para comparar 

os resultados. Quais sao as hipoteses em teste? 

2.5.9. Foi medido o nivel de determinado hormonio em 50 mulheres jovens que nao estavam em gestagao e em 50 mulheres 

jovens que estavam no primeiro trimestre de gestagao. Foram obtidas as medias, 93 e 110, respectivamente, e obtido um 
p-valor para um teste unilateral igual a 0,001, porque havia informagbes na literatura de que gestantes teriam maior 
quantidade desse hormonio. Escreva as hipoteses e interprete o p-valor. 

2.5.10. Escolha uma das alternativas abaixo para interpretar a expressao “resultado significante”: 

a) A pesquisa e de boa qualidade. 

b) O pesquisador aceitou a hipotese da nulidade com probabilidade de 0,5. 

c) A probabilidade de o estudo ser verdadeiro e maior do que 5%. 

d) A probabilidade de o pesquisador ter obtido o resultado que obteve por acaso e 10,05. 

2.5.11. Quais dos seguintes procedimentos reduz o poder de um teste de hipoteses 27 ? 

a) Aumentar o tamanho da amostra. 

b) Aumentar o nivel de significancia. 

c) Aumentar a probabilidade de erro Tipo II. 

Escolha a resposta: 

a) Aumentar o tamanho da amostra. 

b) Aumentar o nivel de significancia. 

c) Aumentar a probabilidade de erro Tipo II. 

d) Todos os itens listados. 

e) Nenhum dos itens listados. 


24 Power of a Hypothesis Test. Disponivel em: http://stattrek.com/hypothesis-test/power-of-test.aspx7Tutorial. Acesso em 24 de 
outubro de 2017. 

25 Veja o Capitulo 9 de VIEIRA, S. Introdugao a Bioestadstica. 4. ed. Rio de Janeiro: Campus/Elsevier, 2008. 

26 Prova: Analista do CNMP (Conselho Nacional do Ministerio Publico), 2015. 

27 Power of a Hypothesis Test. Disponivel em: http://stattrek.com/hypothesis-test/power-of-test.aspx7Tutorial. Acesso em 24 de 
outubro de 2017. 
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Testes nao Parametricos para 
Comparar Dois Grupos 



Neste Caprtulo sao apresentados testes nao parametricos indicados para comparar dois grupos 
independentes ou dependentes, nos casos em que a variavel em analise e ordinal ou e numerica. 



3.1. POSTOS EM LUGAR DE DADOS 


Os estudos de estatistica se iniciam com os calculos de medias e desvios padrao de dados 
coletados. Alguns dos testes nao parametricos mais conhecidos sao, porem, aplicados nao aos 
dados coletados, mas aos postos dos dados. Embora muitas pessoas aprendam a fazer esses testes 
(ou, simplesmente, utilizem um programa de computador), ainda e dificil deixar de olhar para as 
medias dos dados originals. No entanto, alguns dos testes que vamos ver neste Caprtulo, e no 
Caprtulo 4, fazem inferencia com base nos postos dos dados - e sao os postos que devem ser 
comparados. 

Vamos ver como se obtem os postos. Comece colocando os n dados observados em ordem 
crescente. Depois, atribua um numero de ordem a cada dado observado. Esse numero e o posto, 28 
indicado por R. O menor posto eleo maior posto e n. 


Exemplo 3.1 

Logo apos cirurgia para extraqao de um dente, oito pessoas deram notas de 0 a 10 a atenqao que receberam do cirurgiao-dentista. 
As notas foram: 7,5; 6; 5,5; 8; 9,5; 6,5; 4,5; 9. Para conferir postos, coloque as notas em ordem crescente. Depois atribua um 
numero de ordem a cada nota. Esse numero e o posto. 


Posto, segundo a nota conferida em uma pesquisa de satisfagao 


Nota 


Posto 


4.5 1 

5.5 2 

6 3 

6.5 4 

7.5 5 

8 6 

9 7 

9.5 8 


Podem ocorrer dados com o mesmo valor. Chamamos isso de empate. 29 Valores empatados 
devem receber o mesmo posto, mas faqa assim: escreva os dados em ordem crescente e atribua 
aos dados, mesmo que empatados, postos diferentes. Depois, calcule a media dos postos 
ocupados pelos valores empatados. Essa media sera o posto dos valores empatados. 


Exemplo 3.2 

Logo apos uma cirurgia para extra^ao de dente, oito pessoas deram notas de 0 a 10 a atengao que receberam do cirurgiao- 
dentista: 7,5; 6; 5,5; 8; 9,5; 6; 4,5; 9. Para conferir postos as notas, coloque as notas em ordem crescente e atribua um numero de 
ordem a cada nota. As notas em negrito constituem empate. Elas receberam postos 3 e 4. A media desses numeros e 3,5. Este e o 
posto desses dois empates. 






Posto, segundo a nota conferida em uma pesquisa de satisfagao 


Dado 

Posto 

4,5 

1 

5,5 

2 

6,0 

3,5 

6,0 

3,5 

7,5 

5 

8,0 

6 

9,0 

7 

9,5 

8 


Se o numero de empates for pequeno, a soluqao apresentada aqui para tratar os empates e 
satisfatoria. 30 

Dica: se voce estiver fazendo calculos a mao, ou se a amostra for grande e os empates forem 
muitos, verifique as contas. E facil: haja ou nao empates, voce tera sempre: 


'Z.R— n x 


n+ 1 
2 


(3.1) 


Para o Exemplo 3.2, a soma dos postos e: 


Exemplo 3.3 


5.R = 1 + 2 + 3,5 + 3,5 + 4 + 5 + 6 + 7 + 8 = 36 


Como n = 8: 


n x 


n +1 
2 


= 8 x 


8 + 1 
2 


= 36 


Para os dados do Exemplo 3.2, a igualdade (3.1) esta verificada. 







3.2. COMPARAgAO DE DOIS GRUPOS INDEPENDENTES 


3.2.1. Grupos independentes 

Dois grupos de dados sao independentes se as unidades de um deles nao tern relagao com as 
unidades do outro. 


Exemplo 3.4 

Para testar a eficacia de uma nova droga para reduzir a pressao arterial, uma industria farmaceutica fez o seguinte ensaio: 
recrutou voluntarios que tinham pressao arterial alta e mediu a pressao arterial de cada um deles no inicio do ensaio. Depois os 
dividiu aleatoriamente em dois grupos. Um grupo, denominado tratado, recebeu a droga em teste e o outro grupo, denominado 
controle, recebeu o tratamento convencional. No final do ensaio, a pressao arterial de cada voluntario foi novamente medida. 
Calculou-se, entao, a diferenga entre a pressao no final do ensaio e a pressao no inicio, o que resultou em dois grupos 
independentes de dados. 



Figura 3.1 - Dados independentes. 


3.2.2. Teste de Mann-Whitney 


















O teste de Mann-Whitney e tambem conhecido como teste U de Mann-Whitney, teste de 
Wilcoxon-Mann-Whitney, teste dos postos somados de Wilcoxon. 

Indicagao: O teste de Mann-Whitney e indicado para comparar dois grupos independentes, como 
homens e mulheres, tratado e controle, empregado e desempregado. Recomenda-se que as 
amostras tenham tamanhos n 1 > 5 e n 2 > 5. A variavel em analise deve ser ordinal (como escala 
visual analogica ou itens de uma escala Likert) ou contmua (como peso, tempo, QI). As 
observaqoes devem ser independentes, isto e, as unidades de um grupo nao devem estar 
relacionadas com as unidades do outro grupo nem devem estar relacionadas entre si. A hipotese 
em teste e a de que postos dos dois grupos tern a mesma distribuiqao. 31 Portanto, o teste de 
Mann-Whitney nao testa a hipotese de igualdade de medias da variavel em estudo. 

Para fazer o teste de Mann-Whitney e comparar dois grupos, 1 e 2, com e n 2 de dados, 
respectivamente: 

Primeiro passo : Estabeleqa as hipoteses e o nivel de significance. 

• H 0 : os postos dos dois grupos tern a mesma distribuiqao. 

• L^: os postos dos dois grupos tern distributes diferentes. 

Segundo passo : Denomine Gmpo 1 o grupo com o menor numero de dados. Se n 1 = n 2 , 
denomine Grupo 1 o grupo com a menor soma de postos. Faqa n t + n 2 = n. 

Terceiro passo: Junte os dois grupos em um so conjunto de dados, sem perder a identificaqao dos 
grupos. Ordene os dados e atribua postos a eles. Se houver empates, atribua aos valores iguais a 
media de seus postos, como ja foi visto. 

Quarto passo: Calcule a soma dos postos atribuidos aos dados do Grupo 1, isto e, 5J? 1 ; calcule 
a soma dos postos atribuidos aos dados do Gmpo 2, isto e, 5R 2 .Verifique: 


'LRi + 'LRi = n x 


n +1 
2 


(3.2) 


Quinto passo: Calcule a estatistica U de Mann-Whitney: 





(3.3) 


Sexto passo: Se a amostra for de tamanho n > 30 e houver poucos empates, calcule: 






jj mm 
— 2 

\ n\U2 (wi + fl2 + l) 

* 12 (3.4) 

Setimo passo : Compare o valor calculado de z com o valor crltico dado na tabela de distribuigao 
normal padronizada (Tabela 1 do Apendice), no nlvel estabelecido de significancia. 32 Rejeite a 
hipotese da nulidade toda vez que o valor calculado de z for igual ou maior do que o valor 
crltico. Se estiver usando um programa de computador, voce obtera o p-valor associado ao 
menor valor da estatlstica U. 

Oitavo passo : Compare as medianas (ou as medias) dos postos dos dois grupos. 

Exemplo 3.5 

Foi conduzido um ensaio cli'nico para avaliar a eficacia de uma nova terapia antirretroviral para pacientes com HIV. 33 Trinta 
pacientes foram divididos aleatoriamente em dois grupos de mesmo tamanho: o controle, que recebeu terapia antirretroviral 
padrao, e o tratado, que recebeu a nova terapia antirretroviral. Os dois grupos foram monitorados por 3 meses. O resultado 
primario e a carga viral, relatada como numero de copias de HIV por mililitro de sangue. Os dados estao na Tabela 3.1. 

Tabela 3.1 - Carga viral de pacientes com HIV segundo o grupo 

Grupo 


Terapia padrao 

Nova terapia 

7.500 

400 

8.000 

250 

2.000 

800 

550 

1.400 

1.250 

8.000 

1.000 

7.400 

2.250 

1.020 

6.800 

6.000 

3.400 

920 

6.300 

1.420 

9.100 

2.700 

970 

4.200 

1.040 

5.200 

670 

4.100 

400 

(1) 


Dado censurado: foi obtido, mas o valor estava abaixo do limite minimo para as medigoes do aparelho. 


Primeiro passo 

• H 0 : os postos dos dois grupos tern a mesma distribuigao. 






• H-p os postos dos dois grupos tem distributes diferentes. 

• Nivel de significancia ~ = 0,05. 

Segundo passo : Denomine como Grupo 1 o grupo que recebeu a nova terapia e como Grupo 2 o que recebeu a terapia padrao, 
porque = 14 < n 2 = 15. 

Terceiro passo: Atribua postos aos dados. 


Tabela 3.2 - Carga viral de pacientes com HIV segundo o grupo (Tabela auxiliar) 


1 (Nova terapia) 

Dado 


250 

400 


800 

920 


1.020 


1.400 

1.420 


2.700 

4.100 

4.200 

5.200 
6.000 


7.400 

8.000 


Posto 

1 

2.5 

6 

7 

10 

13 

14 

17 

19 

20 
21 
22 

25 

27.5 

205 


Grupo 


2 (Terapia padrao) 


Dado 


Posto 


400 2,5 

550 4 


670 


5 


970 8 

1.000 9 

1.040 11 

1.250 12 

2.000 15 

2.250 16 

3.400 18 


6.300 23 

6.800 24 


7.500 

8.000 

9.100 


26 

27,5 

29 

230 


Quarto passo: Calcule a soma dos postos atribuidos aos dados dos dois grupos e verifique os calculos usando a formula (3.2): 


I R > + I> 


= n x 


n + 1 
2 


29 + 1 

205 + 230 = 29 X —-— = 435 


Quinto passo: Calcule a estadstica U de Mann-Whitney; uma vez que n 1 < n 2 e R 1 < R 2 . Use a formula (3.3): 


U=YRi~ 



(/?!+ 0 

2 


U = 205 - 


14(14+ 1) 
2 


= 205 - 105 = 100 


Sexto passo: A amostra tem tamanho 29, com poucos empates. Na verdade a amostra deveria ser maior do que 30. Estamos no 
limite. Mesmo assim, vamos usar a estatlstica z, com distribuigao que se aproxima da normal padronizada. Entao, calcule: 


u 


mni 


z = 


rtl/72(rtl + rt2 + l) 

12 


-7== -0,218218 
V525 


Setimo passo: Na tabela de distribuigao normal padronizada, no nivel de significancia de 5% para um teste bilateral, encontra-se o 
valor crrtico 1,959964. O p-valor e 0,827259. Portanto, nao se rejeita a hipotese de que nao ha diferenga entre as duas terapias. 

Empates - Fique atento aos empates. Considere: 

1. Se a amostra for grande, um numero moderado de empates nao muda muito o resultado, 
principalmente se os empates ocorrerem no mesmo grupo. Pode haver perda de poder 
estatfstico se os empates ocorrerem em grupos distintos. 

2. Quando os empates sao muitos, e preciso fazer uma correqao na formula 34 que da o valor 
de U. A formula com correqao nao e dada neste livro, mas os programas para computador 
fazem, automaticamente, a corregao. 

Amostras pequenas: Quando as amostras sao pequenas, a distribuigao da variavel z nao se 
aproxima, satisfatoriamente, da distribuigao normal padronizada. Se n 1 < 15 e n 2 < 15, nao use, 
na sua pesquisa, a aproximagao normal, ou seja, nao calcule o valor de z como indicado na 
formula (3.4) do setimo passo. Use a Tabela 3 do Apendice, que da os valores crfticos de 5 R 1 
para alguns nrveis de significancia. Veja como se usa essa tabela. 

a) Se a hipotese alternativa (HQ for a de que a distribuigao dos dados no grupo 1 e diferente 
da distribuigao dos dados no Grupo 2, encontre, na Tabela 3 do Apendice, o par de valores 


100 - 


14 x 15 


z = 


J 


14 x 15 x (14 + 15+ 1) 
12 



















que esta na coluna encabegada com nivel de significancia ~/2. Por exemplo, se voce 
adotou o mvel de significancia de 0,05, busque a coluna correspondente a 0,025. Rejeite a 
hipotese da nulidade se 51^ for igual ou menor do que o menor numero ou igual ou maior 
do que o maior numero do par. 

b) Se a hipotese alternativa (H x ) for a de que a soma dos postos do grupo 1 e menor do que o 

Grupo 2, encontre, na Tabela 3 do Apendice, o par de valores que esta na coluna 

correspondente ao nivel de significancia ~. Rejeite a hipotese da nulidade se 5 R 1 for igual 
ou menor do que o menor numero do par. 

c) Se a hipotese alternativa (H^ for a de que a soma dos postos do Grupo 1 e maior do que o 

Grupo 2, encontre, na Tabela 3 do Apendice, o par de valores que esta na coluna 

correspondente ao nrvel de significancia ~. Rejeite a hipotese da nulidade se oR } for igual 
ou maior do que o maior numero do par. 


Exemplo 3.6 

Para definir a temperatura ambiente nos laboratories de uma instituigao, foram entrevistados nove tecnicos de um dos 
laboratories: quatro homens e cinco mulheres. Pediu-se a essas pessoas que apontassem a temperatura mais confortavel, mas 
alguem levantou a hipotese de que homens apreciam temperaturas mais baixas. Os dados foram, entao, anotados separadamente 
para cada sexo. Pressupondo que as respostas sejam de uma amostra representativa da populagao de tecnicos dessa instituigao, 
voce diria que a temperatura mais confortavel para homens tern a mesma distribuigao da temperatura mais confortavel para 
mulheres? Para responder a essa pergunta, e preciso fazer um teste estatistico - e o teste indicado aqui e o de Mann-Whitney - 
porque os dois grupos sao independentes e a amostra e muito pequena. 

Temperatura ambiente em graus centigrados, definida como mais confortavel segundo o sexo 

Sexo 


1 lomem 

Mulher 

20 

24 

18 

26 

23 

21 

19 

22 


25 


Primeiro passo 

• Hipotese da nulidade: a variavel tern igual distribuigao nos dois grupos. 

• Hipotese alternativa: homens preferem temperaturas mais baixas. 

• Nivel de significancia ~ T fGfph 

Segundo passo: Denomine como Grupo 1 o grupo de homens e Grupo 2 o grupo de mulheres, porque n 1 = 4 < n 2 = 5. 
Terceiro passo: Atribua postos aos dados. Nao ha empates. 

Temperatura ambiente em graus centigrados, definida como mais confortavel segundo o sexo (Tabela auxiliar: postos) 


Sexo 



Homem 


Mulher 


Temperatura 

Posto 

Temperatura 

Posto 

20 

3 

24 

7 

18 

1 

26 

9 

23 

6 

21 

4 

19 

2 

22 

5 



25 

8 


Quarto passo: Calcule as somas dos postos do Grupo 1 e do Grupo 2. 

oR l = 3 + 1 + 6 + 2 = 12 
oi?2 = 7 + 9 + 4 + + 5 + 8 = 33 

Verifique os calculos usando a formula (3.1): 

Yl 4* 1 9 + 1 

I/?i + I /?2 = « x -y-=12+33 =9x— =45 

Quinto passo : A amostra e muito pequena. A distribuigao da estatlstica U nao se aproxima da normal padronizada - embora o 
resultado com essa aproximagao aparega nas saldas de programas de computador. Procure, entao, na Tabela 3 do Apendice os 
valores crlticos para oiq. Para um teste unilateral com ~ = 0,05, voce deve olhar na coluna de 0,05. Lembre que n 1 = 4 e n 2 = 5. 
Os valores crlticos sao 12-28. O valor calculado de oR 1 e 12. A diferenga entre grupos e, portanto, significante no nlvel de 5%. 

Sexto passo: A media dos postos para o Grupo 1 (homens) e 3; a media dos postos para o Grupo 2 (mulheres) e 8,25. A 
temperatura ambiente que homens consideram confortavel e menor que a temperatura ambiente que mulheres consideram 
confortavel. Essa diferenga e significante no nivel de 5%. 


Se voce usar o programa Statistica 35 vai obter resultados que precisam ser bem examinados 
(toda saida de computador deve ser estudada antes de se chegar a uma conclusao). O valor de z 
(nao ajustado para empates) e igual ao valor de z ajustado porque nao houve empates. O p-valor 
e nao significante para um teste bilateral. No entanto, a proposta e proceder a um teste unilateral. 
Entao, p-valor e 0,031746, portanto significante. No entanto, o valor calculado de z nao tern 
distribuiqao que possa ser considerada aproximadamente normal padronizada. 


Mann-Whitney U Test 
By variable SEXO 
Group 1: H Group 2: M 



Rank Sum 

Rank 

Sum 


z 


Valid N 

Valid N 

2*lsided 


Group H 

Group MU Z 

p-level 

adjusted 

p-level 

Group H 

GroupM 

exact p 

TEMPERAT 

12 

33 2 -1,96 

0,05005 

-1,9596 

0,05005 

4 

5 

0,06349 




Voce pode - e deve - usar um programa de computador para fazer os calculos. No entanto, os 
pesquisadores precisam saber interpretar os resultados. Nas sardas dos programas podem 
aparecer diversas estatrsticas - e e bom saber que nem todas devem ser usadas por isso e 
preciso fazer opgoes, mas com conhecimento de causa. Os programas em geral fornecem, no 
caso do teste de Mann-Whitney, as somas dos postos, as estatrsticas de teste com e sem corregao 
para empates com os respectivos p-valores e - as vezes - o p-valor obtido da normal 
padronizada, mesmo para amostras pequenas. Fique atento. 

3.2.3. Teste da mediana 

Indicagao: O teste da mediana deve ser aplicado para testar a hipotese de que dois grupos 
independentes provieram de populates com a mesma mediana. E particularmente indicado 
quando existem dados censurados. Tern menor poder do que o teste de Mann-Whitney. 

Veja como se faz o teste: 

Primeiro passo: Estabelega as hipoteses e o nivel de significance. 

Segundo passo: Junte os grupos, com n t e n 2 dados, em um so conjunto de n 1 + n 2 = n dados. 
Calcule a mediana desse conjunto unico de dados. 

Terceiro passo: Conte o numero de dados iguais ou menores do que a mediana e o numero de 
dados maiores do que a mediana nos dois grupos. Arranje as contagens em tabela 2x2, como 
mostra o esquema. 


Dados 


Grupo 


1 2 


Menores ou iguais a mediana 
Maiores do que a mediana 


Quarto passo: Sob a hipotese de que os dois grupos provem de populates com a mesma 
mediana, metade dos dados de cada grupo deve ser igual ou menor do que a mediana e metade 
deve ser maior do que a mediana. Aplique o teste de X 2 para testar essa hipotese. 36 

Exemplo 3.7 

Para testar a hipotese de que desencorajar pessoas afeta o rendimento delas em um teste de inteligencia, 40 estudantes foram 
divididos ao acaso em dois grupos, o controle e o tratado. 37 Todos eles fizeram a primeira parte de um teste de inteligencia. Duas 
semanas depois, os mesmos estudantes foram chamados para fazer a segunda parte do teste. O grupo controle fez essa parte do 
teste em condigoes normals, mas o grupo tratado foi desencorajado a fazer essa segunda parte porque - os pesquisadores 
informavam a eles - haviam obtido escores muito baixos na primeira parte. E preciso calcular as diferengas entre os escores 
obtidos na primeira e na segunda parte do teste para cada grupo de estudantes. 

Diferengas entre os escores obtidos nas duas partes do teste de inteligencia segundo o grupo 


Grupo 


Controle 


Tratado 


-1 

8 

3 

13 

0 


7 

-5 

4 

-4 

-5 


Diferengas entre os escores obtidos nas duas partes do teste de inteligencia segundo o grupo (cont.) 

Grupo 


Controle 

1 

6 

2 

16 

3 

14 

1 

4 
1 

-3 

9 

3 

3 

5 
2 


Tratado 

-7 

-2 

0 

-6 

6 

-3 

-3 

-3 

2 

-4 

-3 

1 

-9 

-4 

0 


Primeiro passo 

• H 0 : os grupos provem de populates com a mesma mediana. 

• os grupos provem de populates com diferentes medianas. 

• Nivel de significance de 5%, teste bilateral. 

Segundo passo: Combine os 20 + 20 = 40 dados em um so conjunto. A mediana e 1. 

Terceiro passo: Conte, em cada grupo, quantos dados sao menores ou iguais a mediana (em negrito na tabela auxiliar) e quantos 
sao maiores. 


Diferengas entre os escores obtidos nas duas partes do teste de inteligencia segundo o grupo (Tabela auxiliar) 

Grupo 

Controle Tratado 

-1 7 

8 -5 


3 


4 


13 


-4 


0 

1 

6 

2 

16 


-5 

-7 

-2 

0 

-6 


Diferenqas entre os escores obtidos nas duas partes do teste de inteligencia segundo o grupo (Tabela auxiliar) (cont.) 

Grupo 


Controle 

3 

14 

1 

4 
1 

-3 

9 

3 

3 

5 
2 


Tratado 

6 

-3 

-3 

-3 

2 

-4 

-3 

1 

-9 

-4 

0 


Organize os resultados em uma tabela. 

Distribui^ao das diferen^as entre os escores obtidos nas duas partes do teste de inteligencia segundo o grupo e seu valor em 

relaq:ao a mediana 


Dados 

Controle 

Grupo 

Tratado 

Total 

Menores ou iguais a mediana 

6 


16 

22 

Maiores do que a mediana 

14 


4 

18 

Total 

20 


20 

40 


Quarto passo: Aplique o teste de ^ '2. Neste exemplo, X 2 = 10,101, p-valor = 0,001482. Portanto, desencorajar pessoas 
invocando pretenso mau desempenho afeta o rendimento delas. 


3.3. COMPARAgAO DE DOIS GRUPOS DEPENDENTES 


3.3.1. Grupos dependentes 

Dois grupos de dados sao dependentes se cada unidade de um dos grupos corresponde a uma 
unidade do outro grupo. Uma dica para saber se dois grupos sao dependentes e buscar, na 
descriqao da pesquisa, palavras como dados pareados, dados emparelhados, antes e depois. 

Exemplo 3.8 

Para testar a eficacia de uma nova droga que, se presume, reduz a pressao arterial, uma industria farmaceutica recrutou diversos 
voluntarios que tinham pressao arterial alta. Foi, entao, medida a pressao arterial de cada pessoa e, em seguida, fornecida a droga. 
Depois de a droga ter sido administrada, a pressao arterial dos voluntarios foi, novamente, medida. Os dados sao dependentes 
porque foram obtidos na mesma pessoa. Veja a Figura 3.2. 



Figura 3.2 - Dados dependentes. 


3.3.2. Teste dos postos assinalados de Wilcoxon 

Indicagao : O teste dos postos assinalados de Wilcoxon compara dados pareados. A variavel em 












analise deve ser ordinal ou numerica, porque o procedimento do teste exige calcular as 
diferenqas entre os pares de dados. Veja como se faz o teste: 

Primeiro passo: Estabeleqa as hipoteses e o nivel de significancia. 

Segundo passo: Calcule a diferenqa entre cada par de dados. Exclua toda diferenqa igual a zero. 
Terceiro passo: Obtenha os valores absolutos das diferenqas. 

Quarto passo: Atribua postos aos valores absolutos das diferenqas. 

Quinto passo: Coloque sinais nos postos, que passam a se chamar postos assinalados. No 
entanto, observe os criterios: 

• Postos das diferenqas com sinal negativo ficam com sinal negativo. 

• Postos das diferenqas com sinal positivo ficam com sinal positivo. 

Sexto passo: Some os postos assinalados. Indique a soma por SR. Some os quadrados dos postos 
assinalados. Indique a soma dos quadrados dos postos assinalados por £ R 2 . 

Setimo passo: Calcule a estatrstica de teste z que, sob a hipotese da nulidade, tern distribuiqao 
aproximadamente normal padronizada desde que n 12 20. 


z = 


YR 


(3.5) 


Oitavo passo: Faqa 0 teste que consiste em comparar 0 valor calculado de z com 0 valor crrtico 
dado na tabela de distribuiqao normal padronizada (Tabela 1 do Apendice) no nivel estabelecido 
de significancia. Se voce estiver usando um programa de computador, obtera 0 p-valor. 


Exemplo 3.9 

Foi feito um estudo para saber se a escuta e dicotica, isto e, se a capacidade de percepgao auditiva tem grau diferente em cada um 
dos ouvidos. 38 Cada participante da pesquisa ouviu uma serie de palavras, apresentadas aleatoriamente do lado direito e do lado 
esquerdo, e relatou o que ouviu. Ouve-se melhor de um lado do que de outro? 

Numero de palavras ouvidas corretamente, segundo o lado em que foram ditas, para cada participante de pesquisa 

Participante Lado 


Direito 

Esquerdo 

25 

32 

32 

30 

15 

8 

25 

32 

32 

20 

24 

32 

26 

32 

29 

31 


8 





9 

32 

28 

10 

32 

32 

11 

20 

30 

12 

5 

32 

13 

15 

18 

14 

18 

19 

15 

29 

26 

16 

27 

30 

17 

14 

19 

18 

16 

20 

19 

25 

15 

20 

23 

32 


Para fazer o teste de Wilcoxon: 

Primeiro passo: Sao n = 20 participantes de pesquisa. 

• H 0 : a capacidade de percepgao auditiva tern o mesmo grau nos dois ouvidos. Teste bilateral, nivel de significancia de 5%. 
Segundo passo: Calcule a diferenqa entre cada par de dados. Exclua toda diferenqa igual a zero. 

Numero de palavras ouvidas corretamente, segundo o lado em que foram ditas, para cada participante de pesquisa (Tabela 

auxiliar) 


Participante 


Lado 


Dilereni.a 


Direito 


Esquerdo 


1 

25 


32 

-7 

2 

32 


30 

2 

3 

15 


8 

7 

4 

25 


32 

-7 

5 

32 


20 

12 

6 

24 


32 

-8 

7 

26 


32 

-6 

8 

29 


31 

-2 

9 

32 


28 

4 

10 

32 


32 

Excluido 

11 

20 


30 

-10 

12 

5 


32 

-27 

13 

15 


18 

-3 

14 

18 


19 

-1 

15 

19 


26 

-7 

16 

27 


30 

-3 

17 

14 


19 

-5 

18 

16 


20 

-4 

19 

25 


15 

10 


20 


23 


32 


-9 


Terceiro passo: Obtenha os valores absolutos das diferen^as. 


Numero de palavras ouvidas corretamente, segundo o lado em que foram ditas, para cada participante de pesquisa (Tabela 

auxiliar) 


Participante 


Lado 

DilereiK.i 

Valor absoluto 


Direito 

Esquerdo 



1 

25 

32 

-7 

7 

2 

32 

30 

2 

2 

3 

15 

8 

7 

7 

4 

25 

32 

-7 

7 

Numero de palavras ouvidas corretamente, segundo o lado em que foram ditas, para cada participante de pesquisa (Tabela 

auxiliar) (cont.) 

Participante 


Lado 

DilereiK.i 

Valor absoluto 


Direito 

Esquerdo 



5 

32 

20 

12 

12 

6 

24 

32 

-8 

8 

7 

26 

32 

-6 

6 

8 

29 

31 

-2 

2 

9 

32 

28 

4 

4 

10 

32 

32 

Excluido 


11 

20 

30 

-10 

10 

12 

5 

32 

-27 

27 

13 

15 

18 

-3 

3 

14 

18 

19 

-1 

1 

15 

19 

26 

-7 

7 

16 

27 

30 

-3 

3 

17 

14 

19 

-5 

5 

18 

16 

20 

-4 

4 

19 

25 

15 

10 

10 

20 

23 

32 

-9 

9 


Quarto passo: Atribua postos aos valores absolutos das diferen^as. Como sao 19 participantes da pesquisa, isto e, n = 19 porque 
um foi excluido, os postos vao de 1 a 19. Verifique a igualdade definida pela formula (3.1). 

Numero de palavras ouvidas corretamente, segundo o lado em que foram ditas, para cada participante de pesquisa (Tabela 

auxiliar) 

Participante Lado Difeimt a Valor absoluto Posto 


Direito 


Esquerdo 


1 

25 


32 

-7 

7 

11,5 

2 

32 


30 

2 

2 

2,5 

3 

15 


8 

7 

7 

11,5 

4 

25 


32 

-7 

7 

11,5 

5 

32 


20 

12 

12 

18 

6 

24 


32 

-8 

8 

14 

7 

26 


32 

-6 

6 

9 

8 

29 


31 

-2 

2 

2,5 

9 

32 


28 

4 

4 

6,5 

10 

32 


32 

Exclmdo 



11 

20 


30 

-10 

10 

16,5 

12 

5 


32 

-27 

27 

19 

13 

15 


18 

-3 

3 

4,5 

14 

18 


19 

-1 

1 

1 

Numero de palavras ouvidas corretamente, segundo o lado em que foram ditas, para cada participante de pesquisa (Tabela 





auxiliar) (cont.) 



Participante 

Direito 

Lado 

Esquerdo 

Diferen^a 

Valor absoluto 

Posto 

15 

19 


26 

-7 

7 

11,5 

16 

27 


30 

-3 

3 

4,5 

17 

14 


19 

-5 

5 

8 

18 

16 


20 

-4 

4 

6,5 

19 

25 


15 

10 

10 

16,5 

20 

23 


32 

-9 

9 

15 







5 R =190 




I* 

19+1 

= 19 X —-— =190 

2 



Quinto passo: Coloque sinais nos postos, que passam a se chamar postos assinalados. No entanto, observe os criterios: 

• Postos de diferengas 

com sinal negativo ficam corr 

i sinal negativo. 



• Postos de diferengas 

com sinal positivo ficam com 

sinal positivo. 



Numero de palavras ouvidas corretamente, segundo o lado em que foram ditas, para cada participante de pesquisa (Tabela 





auxiliar) 



Participante 

Lado 

Diferen^a Valor absoluto 

Posto 

Posto assinalado 

Direito 

Esquerdo 





i 

25 

32 


-7 7 

11,5 

-11,5 

2 

32 

30 


2 2 

2,5 

2,5 

3 

15 

8 


7 7 

11,5 

11,5 



4 

25 

32 

-7 

7 

11,5 

-11,5 

5 

32 

20 

12 

12 

18 

18 

6 

24 

32 

-8 

8 

14 

-14 

7 

26 

32 

-6 

6 

9 

-9 

8 

29 

31 

-2 

2 

2,5 

-2,5 

9 

32 

28 

4 

4 

6,5 

6,5 

10 

32 

32 

Excluido 




11 

20 

30 

-10 

10 

16,5 

-16,5 

12 

5 

32 

-27 

27 

19 

-19 

13 

15 

18 

-3 

3 

4,5 

—4,5 

14 

18 

19 

-1 

1 

1 

-1 

15 

19 

26 

-7 

7 

11,5 

-11,5 

16 

27 

30 

-3 

3 

4,5 

-4,5 

17 

14 

19 

-5 

5 

8 

-8 

18 

16 

20 

-4 

4 

6,5 

-6,5 

19 

25 

15 

10 

10 

16,5 

16,5 

20 

23 

32 

-9 

9 

15 

-15 


Sexto passo: Some os postos assinalados e some os quadrados dos postos assinalados. 

A soma dos postos negativos e -135. A soma dos postos positivos e 55. Logo, 5 R = -80 e a soma dos quadrados dos postos 
assinalados e 2.463. 

Setimo passo: calcule a estatistica de teste z que, sob a hipotese da nulidade, tern distribuigao aproximadamente normal 
padronizada desde que 39 n n 25. 


Oitavo passo: O valor critico da distribuigao normal padronizada (Tabela 1 do Apendice) no nivel de significancia de 5% e 
±1,96. Como o valor calculado de z = -1,61 e menor que o valor crrtico, nao se rejeita a hipotese de que a capacidade de 
percepgao auditiva tenha o mesmo grau nos dois ouvidos. Um programa de computador dara p-valor = 0,1974. 

Zeros e empates: Como zero nao e nem positivo nem negativo, deve ser excluido, mas a 
amostra se reduz. 

Um ou outro empate nao muda o resultado do teste se a amostra for grande. No entanto, se 
houver muitos empates, a confiabilidade do teste fica reduzida. E preciso usar nao a formula 
(3.6), mas uma formula com correqao. 40 

Nao e dada aqui a maneira de fazer essa correqao porque aumenta, em muito, a dificuldade de 
calculo. No entanto, convem saber que os programas para computador fazem a corregao e 
fornecem o resultado do teste, com e sem a correqao para empates. Uma opiniao 41 interessante 
sobre esse assunto e a de que, se existem muitos zeros e muitos empates, o processo de mediqao 
deveria ser melhorado. No exemplo que vimos, a variavel nao e contfnua - o que aumenta a 




possibilidade de empates. O teste de Wilcoxon e mais confiavel quando a variavel e contmua. De 
qualquer forma, no exemplo, se a qualidade da medigao melhorasse, o resultado seria mais 
confiavel. 

Amostras pequenas: Quando as amostras sao pequenas, isto e, n < 20 e, particularmente, n < 
10, a distribuigao da variavel z nao se aproxima, satisfatoriamente, da distribuigao normal 
padronizada. Nesses casos: 

a) some os postos com sinal positivo; 

b) some os postos com sinal negativo; 

c) compare o valor absoluto das duas somas. A menor soma de postos em valor absoluto e 
chamada de W ; 

d) rejeite a hipotese da nulidade toda vez que o valor calculado de W for maior do que o valor 
dado na Tabela 4 do Apendice, no nrvel estabelecido de significancia. 


Exemplo 3.10 

Oito criangas participaram de um estudo sobre a efetividade de uma nova droga que se supoe reduzir o comportamento repetitivo 
de criangas autistas. 42 Foi medido o tempo em que cada crianga se envolveu em comportamentos repetitivos durante um periodo 
de 3 horas tanto antes como depois de tomar o medicamento durante uma semana. Os dados estao apresentados a seguir. 

Tempo despendido por criangas autistas em comportamentos repetitivos durante um periodo de observagao de 3 horas segundo o 

grupo 


Crianga 


1 

2 

3 

4 

5 

6 

7 

8 


Grupo 


Antes da medicagao 

85 

70 

40 

65 

80 

75 

55 

20 


Depois da medicagao 

75 

50 

50 

40 

20 

65 

40 

25 


Primeiro passo: 

• Hipotese da nulidade: a droga nao tern efeito. 

• Hipotese alternativa: a droga tem efeito. 

• Nivel de significancia de 5%, teste bilateral. 

Segundo passo: Organize os dados em uma tabela. Calcule as diferengas entre antes e depois de os pacientes terem sido 
medicados. 


Tempo despendido por criangas autistas em comportamentos repetitivos durante um periodo de observagao de 3 horas segundo o 

grupo (Tabela auxiliar - diferengas) 


Crianga 

Antes da medicagao 

Grupo 

Depois da medicagao 

Diferenga entre grupos 

1 

85 


75 

10 

2 

70 


50 

20 

3 

40 


50 

-10 

4 

65 


40 

25 

5 

80 


20 

60 

6 

75 


65 

10 

7 

55 


40 

15 

8 

20 


25 

-5 


Terceiro passer. Obtenha os valores absolutos das diferengas. 


Tempo despendido por criangas autistas em comportamentos repetitivos durante um periodo de observagao de 3 horas segundo o 

grupo (Tabela auxiliar - valores absolutos das diferengas) 


Crianga 


Grupo 

Diferenga 

Valor absoluto da diferenga 


Antes 

Depois 




1 

85 

75 

10 


10 

2 

70 

50 

20 


20 

3 

40 

50 

-10 


10 

4 

65 

40 

25 


25 

5 

80 

20 

60 


60 

6 

75 

65 

10 


10 

7 

55 

40 

15 


15 

8 

20 

25 

-5 


5 

Quarto passo: Atribua postos aos valores absolutos das diferengas. Como sao oito os participantes da pesquisa, os postos vao i 
1 a 8. Verifique a igualdade definida pela formula (3.1). 

Tempo despendido por criangas autistas em 

comportamentos repetitivos durante um 
grupo (Tabela auxiliar - postos) 

periodo de observagao de 3 horas segundo 

Crianga 

Grupo 

Diferenga Valor absoluto da diferenga Posto 


Antes 

Depois 




1 

85 

75 

10 

10 

3 

2 

70 

50 

20 

20 

6 

3 

40 

50 

-10 

10 

3 

4 

65 

40 

25 

25 

7 

5 

80 

20 

60 

60 

8 

6 

75 

65 

10 

10 

3 

7 

55 

40 

15 

15 

5 

8 

20 

25 

-5 

5 

1 


36 


S 8 + 1 

R = 8x—y- = 36 

Quinto passo: Coloque sinais nos postos, que passam a se chamar postos assinalados. Depois, some os postos com sinal negativo 
e com sinal positivo. 

Tempo despendido por criangas autistas em comportamentos repetitivos durante um periodo de observagao de 3 horas segundo o 

grupo (Tabela auxiliar - postos assinalados) 


Crianga 

Antes 

Grupo 

Depois 

Diferenga 

Valor absoluto da diferenga 

Posto 

Posto assinalado 

1 

85 

75 

10 

10 

3 

3 

2 

70 

50 

20 

20 

6 

6 

3 

40 

50 

-10 

10 

3 

-3 

4 

65 

40 

25 

25 

7 

7 

5 

80 

20 

60 

60 

8 

8 

6 

75 

65 

10 

10 

3 

3 

7 

55 

40 

15 

15 

5 

5 

8 

20 

25 

-5 

5 

1 

-1 


• Soma dos postos com sinal negativo: - 4. 

• Soma dos postos com sinal positivo: +32. 

• 5 Ri = - 4 +32 = 28 

• W= 4 

Como a amostra e peqnena (n = 8), procure o valor critico para W na Tabela 4 do Apendice (lembre-se de que W e a menor soma 
de postos em valor absoluto). Para ~ = 0,05 e amostras de tamanho n = 8, o valor critico e 4. Como a menor soma obtida 
desprezando o sinal e W = 4, voce pode afirmar, no nivel de 5% de significancia, que a nova droga tern efeito sobre o 
comportamento de criangas autistas. 


3.3.3. Teste do sinal 

Indicagao: O teste do sinal e a forma mais facil de comparar dois grupos dependentes. Mesmo 
assim, nao e muito indicado porque tem pouco poder; usa como informaqao apenas o sinal das 
diferenqas entre pares de dados. 43 

A unica pressuposiqao necessaria para a aplicaqao do teste do sinal e que a distribuiqao da 
variavel seja continua, porque usa o sinal das diferenqas. Ainda, para usar a aproximaqao normal 
como mostrado aqui, e preciso ter grandes amostras. 44 

Veja como se faz o teste. 

Primeiro passo: Estabeleqa as hipoteses e o nivel de significancia. 



Segundo passo : Compare o valor da primeira medida com o valor da segunda medida, feitas no 
mesmo par de pessoas, animais ou objetos; atribua sinal + (mais) para todo par de observagoes 
em que a primeira medida foi maior do que a segunda e sinal - (menos) quando acontecer o 
contrario. 

Terceiro passo: Conte o numero de sinais + (mais) e o numero de sinais - (menos). Exclua toda 
diferenga igual a zero. 

Quarto passo: Sob a hipotese da nulidade, medidas feitas no mesmo par sao iguais. Entao, sob 
essa hipotese, metade (50%) das diferengas entre pares teria sinal + (mais) e a outra metade 
(50%) sinal - (menos). Logo, sob a hipotese da nulidade, a proporgao de sinais - (menos) e 0,5. 
Para testar essa hipotese, calcule a estatistica: 


Z = 


(|p-0,5|)- 


1 

2 x n 


a p 


(3.7) 


em que n e o tamanho da amostra descontados os pares de dados com diferenga zero, pea 
proporgao de sinais - (menos) e — e o desvio padrao 45 sob a hipotese da nulidade, isto e: 


G P = 


\ 


0,5(1 - 0,5) 


(3.8) 


Empates: Quando ocorre empate, a diferenga fica igual a zero. Se o numero de zeros for 
pequeno, eles podem ser ignorados como foi feito aqui, mas isso reduz o tamanho da amostra. Se 
o numero de zeros for grande, adote outro procedimento. 46 

Quinto passo: Para fazer o teste, compare o valor calculado de z com o valor crftico dado na 
tabela de distribuigao normal padronizada (Tabela 1 do Apendice), no nrvel estabelecido de 
significance. Rejeite a hipotese da nulidade toda vez que o valor calculado de z for igual ou 
maior do que o valor de z dado na tabela. Se usar um programa de computador, achara o p-valor. 


Exemplo 3.11 

Para decidir pela compra de um de dois tomografos fabricados por empresas diferentes, o diretor de um instituto separou 20 
cranios e fez duas tomadas tomograficas de cada um: a primeira usando o tomografo da marca A e a segunda usando o tomografo 
da marca B. Depois, pediu a um tecnico que examinasse as tomografias e conferisse, a cada uma delas, uma nota de 0 (pessima) a 
5 (excelente). Os resultados sao dados em seguida. 


Notas conferidas por um tecnico para tomografias obtidas por dois tomografos 


Cranio 

Tomografo 


Sinal da diferenga 


A 

B 



1 


5 


3 


+ 





2 

3 

4 

5 

6 

7 

8 

9 

10 
11 
12 

13 

14 

15 

16 

17 

18 

19 

20 


5 

5 

4 

4 

5 
2 
4 

4 

5 

4 
0 

5 

4 

5 
5 
5 
4 
4 
2 


2 

1 

2 

5 

2 

1 

5 

2 

4 

3 
1 

4 
2 
3 
2 
1 
2 

5 
5 


+ 

+ 


+ 


+ 

+ 

+ 


Primeiro passo: A hipotese da nulidade e a de que as tomografias feitas pelos tomografos das duas marcas tern a mesma 
qualidade. Seja ~ = 0,05, teste bilateral. 

Segundo passo: Atribua sinal + (mais) para todo par de observa^bes em que o tomografo da marca A recebeu nota mais alta do 
que o da marca B e sinal - (menos) quando aconteceu o contrario. Exclua toda diferenga igual a zero. 

Terceiro passo: O tomografo da marca A teve melhor avaliagao 15 vezes e o da marca B, cinco vezes. 

Quarto passo: Para aplicar a formula (3.7), voce precisa obter a proporgao p de sinais - (menos) na amostra e o desvio padrao 
p, dado pela formula (3.8). Entao: 


p = — = 0,25 
H 20 


0,5 x (1 - 0,5) 


20 


= 0,11180 


Para obter a estatfstica z, calcule: 


z = 


(|0,25-0,5|)- 


I 

2 x 20 


0,11180 


2,012 


O valor critico de z para ~ T 0,05 e 1,96. Como o valor calculado z = 2,012 e maior do que o valor critico, pode-se afirmar que o 
tomografo da marca A produz tomografias de melhor qualidade do que o da marca B. 





Se voce usar o programa Statistica para fazer os calculos, obtera: 


Sign Test 



No. of Non-ties 

Percent v < V 

z 

p-level 

Tomo A & Tomo B 

20 

25 

2,012461 

0,044171 


RESUMO E OBJETIVO DO CAPITULO 


Lido este Capitulo, voce sera capaz nao so de aplicar os testes apresentados, mas tambem de 
saber por que foram aplicados. Sao duas situagoes em que se recomenda o uso de estatistica nao 
parametrica: 

1. Comparagao de amostras independentes: teste de Mann-Whitney ou teste da mediana. 

2. Comparagao de duas amostras dependentes : teste dos postos assinalados de Wilcoxon ou 
teste do sinal. 


28 Posto e a tradugao para a palavra inglesa rank. Dai, o uso da letra R para indicar posto. Alguns estatisticos traduzem rank por 
ranque e usam a palavra ranquear para dizer conferir postos. 

29 Em ingles, tie. 

30 Se mais de urn ter^o dos dados estiver envolvido em tais empates, e preciso buscar outra soluqao. Veja 

LEHMANN, E.L. Nonparametrics: Statistical Methods Based on Ranks. San Francisco: Holden Day, 1975.CONOVER, W.J. 
Practical Nonparametric Statistics. 2 nd ed. Nova York: Wiley, 1980.GIBBONS, J. D. Nonparametric statistics: an 
introduction. Newbury Park: Sage Publications, 1993. 

31 Em termos mais tecnicos, o teste de Mann-Whitney e indicado para testar a hipotese de que as amostras provem de populates 
tais que a probabilidade de uma observa^ao, tomada ao acaso de uma populagao, ser maior do que outra observagao tomada ao 
acaso da outra popula^ao e de 0,5. 

32 Para estudar distribuigao normal, veja: VIEIRA, S. Introduqao a Bioestatistica. 5. ed. Rio de Janeiro: Elsevier, 2016. 

33 Mann Whitney U Test (Wilcoxon Rank Sum Test) Disponivel em: http://sphweb.bumc.bu.edu/otlt/mph- 
modules/bs/bs704_nonparametric/BS704_Nonparametric4.html. Acesso em 27 de outubro de 2017. 

34 Veja: 

LEHMANN, E.L. Nonparametrics: Statistical Methods Based on Ranks. San Francisco: Holden Day, 1975. 

CONOVER, W.J. Practical Nonparametric Statistics. 2 nd ed. Nova York: Wiley, 1980. 

GIBBONS, J. D. Nonparametric statistics: an introduction. Newbury Park: Sage Publications, 1993. 

HOLLANDER, M.; WOLFE, D.A. Nonparametric Statistics Methods. Nova York: Wiley, 1973. 

35 6 StatSoft, Inc. 2300 East 14 th Street, Tulsa, OK 74104, USA. 

38 Veja o teste de Y 2 no Capitulo 5 deste livro. 

37 GORDON; DUREA. The effect of discouragement on the revised Stanford-Binet scale. J Genetic Psychol 73: 201-7, 1948. 
Apud LEHMANN, EL. Nonparametrics: Statistical Methods Based on Ranks. San Francisco: Holden Day, 1975. p. 47. O 
exemplo e antigo, mas e interessante e e citado por Lehman, um classico. 

38 The Wilcoxon test: users.sussex.ac.uk/~grahamh/.../WilcoxonHandoout2011.pdf. Disponivel em: https://www.google.com.br/. 
Acesso em 31 de outubro de 2017. 

39 Nao e o caso deste exemplo. 

49 Veja: 

LEHMANN, EL. Nonparametrics: Statistical Methods Based on Ranks. San Francisco: Holden Day, 1975. 

CONOVER, WJ. Practical Nonparametric Statistics. 2 nd ed. Nova York: Wiley, 1980. 

41 GIBBONS, JD. Nonparametric statistics: an introduction. Newbury Park: Sage Publications, 1993. p. 18. 



42 Wilcoxon Rank Signed Test. Disponivel em: http://sphweb.bumc.bu.edn/otlt/mph-modules/bs/bs704. Acesso em 1 de 
novembro de 2017. 

43 O teste t usa os valores das diferengas, o teste de Wilcoxon usa os postos das diferengas e o teste do sinal usa os sinais das 
diferengas. 

44 O teste do sinal usa a aproximagao normal da binomial e a distribuigao binomial aproxima-se da distribuigao normal quando 
n~i > 5 e n (1 ~n ) > 5. 

45 Desvio padrao na distribuigao binomial. 

46 Para outras maneiras de proceder, veja, por exemplo: CONOVER, WJ. Practical Nonparametric Statistics. 2 nd ed. Nova York: 
Wiley, 1980. 



3.4.i. i^onsiaere o conjunio ae aaaos: at>; ^4; 5 /; t>o; s/; 43 ; so; o/; ou. /iinoua um posto a caaa aaao e vermque: 


V D ft + 1 

) R = tt x- 

Z, 2 

3.4.2. Imagine que um pesquisador quer determinar se duas linhagens de ratos de laboratorio diferem na habilidade de correr em 
labirinto. 47 Para isso, seleciona uma amostra de ratos ingenuos (que nunca foram ensinados a correr em labirinto) de cada 
linhagem e da o necessario treinamento. Faz, entao, um teste: coloca os ratos para correr em labirinto e conta o numero de 
tentativas de cada um ate conseguir correr no labirinto duas vezes. Veja: 

Linhagem A: 9; 4; 20; 13. 

Linhagem B: 4; 12; 8; 3; 9. 

a) Estabelega a hipotese da nulidade e a hipotese alternativa. b) Aplique o teste de Mann-Whitney no nivel de 5% de 
significancia. De o valor de oRl e os valores criticos de oi?l. c) Conclua. d) Calcule 5R2 e verifique que: 

Z \~’ 71+1 

R, +2^R 2 =nx - 

3.4.3. Em uma pesquisa para estudar o efeito da inalaqao prolongada de cadmio sobre os niveis de hemoglobina, 10 caes foram 
expostos ao oxido de cadmio e 10 caes serviram como controle (nao foram expostos ao oxido de cadmio). Os dados 
obtidos estao apresentados na Tabela 3.3. Faga o teste de Mann-Whitney. 

Tabela 3.3 - Niveis de hemoglobina, em gramas, de caes segundo o grupo 

Grupo 


Exposto 

Controle 

14,6 

15,5 

15,8 

17,9 

16,4 

15,5 

14,6 

16,7 

14,9 

17,6 

14,3 

16,8 

14,7 

16,7 

17,2 

16,8 

16,8 

17,2 

16,1 

18,0 


Fonte: DANIEL, W.W. Applied Nonparametric Statistics. 2 nd ed. Pacific Grove: Duxbury, 2000. p.130. 


3.4.4. Para testar o efeito de um novo analgesico nos casos de cefaleia, foi feito um ensaio clinico randomizado duplo-cego 
placebo-controlado com 17 pacientes. Oito pacientes receberam o novo analgesico (grupo tratado) e nove pacientes 
receberam placebo (grupo controle). Uma hora depois de ingerir o comprimido, os pacientes registraram a dor segundo 
uma escala visual analogica que variava de 0 a 10. Os dados estao na Tabela 3.4. Fa^a o teste de Mann-Whitney. 


Tabela 3.4 - Registro de dor, medida em escala analogica, segundo o grupo 




Grupo 


Tratado 

1 

1.5 
2 
2 

3.5 

5.5 
7 


Controle 

2 

3.5 

4 

5 
8 

8.5 
9 


7,5 


9,5 

10 


3.4.5. Dez restaurantes de uma cidade grande foram selecionados ao acaso para participar de um experimento conduzido pela 
Secretaria da Saude como parte de um esforgo para melhorar as condigSes de higiene nesse tipo de estabelecimento. Os 
chefes de cozinha foram pagos para assistir a um seminario de 3 dias no qual se enfatizaram as vantagens de uma cozinha 
limpa. As cozinhas dos restaurantes foram inspecionadas antes e 6 meses depois de os chefes terem assistido ao 
seminario. Nas duas ocasioes foram atribuidas as notas as condiqbes de higiene das cozinhas, que estao na Tabela 3.5 . 
Faqa o teste de Wilcoxon. 

Tabela 3.5 - Notas das cozinhas dos restaurantes na inspeqao antes e 6 meses depois de os chefes terem assistido ao seminario 

Chefe de cozinha Grupo 



Antes 

Depois 

1 

80 

90 

2 

83 

85 

3 

82 

87 

4 

81 

78 

5 

77 

75 

6 

77 

82 

7 

65 

75 

8 

67 

85 

9 

75 

90 

10 

85 

95 


Fonte: DANIEL, W.W. Applied Nonparametric Statistics. 2 nd ed. Pacific Grove: Duxbury, 2000. p.173. 


3.4.6. Estudando o conformismo social e a autoestima, pesquisadores verificaram, aplicando o teste t de Student a uma amostra 
de 200 estudantes de pos-graduaqao, que o escore medio de autoestima no grupo caracterizado como conformista era 
diferente do escore medio de autoestima do grupo nao conformista. Imagine que o estudo foi repetido com outros 
participantes e os pesquisadores chegaram aos dados apresentados na Tabela 3.6 . Faqa o teste da mediana, porque esta 
amostra e muito menor do que a citada, de 200 estudantes. 

Tabela 3.6 - Escore da autoestima segundo o grupo 

Grupo 


Conformista 


Nao conformista 


48 

59 

55 

58 

56 

48 

49 

57 

41 

59 

55 

45 

44 

59 

53 

68 

42 

61 

50 



Fonte: DANIEL, W.W. Applied Nonparametric Statistics. 2 nd ed. Pacific Grove: Duxbury, 2000. p.131. 


3.4.7. Foi feito um ensaio clmico com oito pacientes que iriam se submeter a extraqao de varios dentes para testar o efeito de um 
ansioli'tico. Os niveis de ansiedade dos pacientes, antes e depois de medicados, registrados usando escala apropriada, 
estao na Tabela 3.7. 


Tabela 3.7 - Niveis de ansiedade antes e depois de os pacientes terem sido medicados 


Paciente 

Antes da medica^ao 

Grupo 

Depois da medica^ao 

1 

23 


14 

2 

26 


14 

3 

28 


29 

4 

29 


25 

5 

37 


31 

6 

26 


18 

7 

27 


30 

8 

32 


30 


3.4.8. Foi feito um ensaio para estudar os efeitos adversos de um farmaco indicado para casos de hipertensao. Os pacientes, com 
o mesmo perfil, recem-diagnosticados e sem tratamento, responderam a diversas questoes ao iniciarem o tratamento e na 
oitava semana apos o inicio. Os dados relativos a fadiga estao apresentados na Tabela 3.8. Neste exemplo, 0 significa 
ausencia do sintoma; 1: o sintoma existe, mas nao incomoda; 2: o sintoma incomoda, mas nao interfere nas atividades; 3: 
interfere na maioria das atividades. Faqa o teste do sinal. 

Tabela 3.8 - Fadiga, medida em uma escala de quatro pontos segundo o grupo 


Paciente Grupo 

Inicio Final 

1 1 2 

2 2 3 

3 0 2 

4 3 0 


5 


1 


0 


6 

3 


1 

7 

3 


2 

8 

3 


3 

9 

2 


2 

10 

2 


0 

11 

3 


1 

12 

0 


0 

13 

2 


2 

14 

2 


3 

15 

2 


1 

16 

3 


0 

17 

2 


0 

18 

3 


1 

19 

3 


0 

20 

2 


2 

21 

2 


3 

22 

3 


1 

23 

3 


0 

Fonte: Dados ficti'cios com base em LUNA, RL. Eficacia e tolerabilidade da associagao bisoprolol/hidroclorotiazida na hipertensao arterial. Arq 

Bras Cardiol 71(4), 1998. 

3.4.9. Foram comparados os tempos de resolugao nos casos de obito intrauterino ocorridos no segundo trimestre de gestagao para 
gestantes submetidas ao misoprostol administrado por vias diferentes. Os dados estao apresentados na Tabela 3.8. Faga o 
teste de Mann-Whitney. 

Tabela 3.9 - Tempo de resolugao, em horas, do obito fetal ocorrido no segundo trimestre de gestagao: comparagao entre as vias 

oral e vaginal 

Grupo 




Oral 


Vaginal 


30 


24 


9 


11 


22 


20 


10 


22 


20 


27 


16 


6 




10 




23 



Fonte: MACAU, S.N.; BERTINI, M.; CAMANO, L. Resolugao do obito intrauterino com o uso de misoprostol intravaginal em baixa dose. Rev 
Bras Ginecol Obstet 5: 232-236, 1992. 

3.4.10. Uma pesquisa comparou a efetividade da propaganda feita por duas marcas rivais de cafe, A e B. Pessoas que estavam em 
urn shopping center receberam, aleatoriamente, ou a propaganda feita por Aoua propaganda feita por B e disseram, entre 


0 e 10, a probabilidade de comprar cafe da marca exibida na propaganda que lhes era mostrada. Os dados estao na Tabela 
5.10. Faga o teste de Mann-Whitney (grupos independentes). 48 A propaganda de uma das marcas se revelou mais efetiva? 


Tabela 3.10 - Notas conferidas a duas marcas de cafe por dois grupos de pessoas 


Marca 


A 


B 


3 


9 


4 


7 


2 


5 


6 


10 


2 


6 


5 


8 


47 O exercfcio e de MINIUM, E.W.; CLARKE, R.C.; COLADARCI, T. Elements of Statistical Reasoning. 2 nd ed. New York: 
Wiley, 1999. p.421. 

48 Veja a solugao detalhada em: 

Mann-Whitney test worked example. Dispom'vel em: http://users.sussex.ac.uk/~grahamh/RMlweb/Mann- 

Whitney%20worked%20example.pdf. Acesso em 4 de novembro de 2017. 



* • • 



Testes nao Parametricos 
para Comparar mais 
de Dois Grupos 



Na area da saude, ha uma busca incessante por novas formas de prevenir, detectar ou tratar 
doengas. Tambem se procura uma maneira de melhorar a qualidade de vida das pessoas com 
doengas cronicas ou minorar o sofrimento no final da vida. No decorrer de todas as fases de tais 
pesquisas sao aplicados conhecimentos de estatrstica, seja para determinar o tamanho da amostra, 
delinear um ensaio ou fazer a analise dos dados coletados. 

Em termos de analise estatrstica - que e o assunto deste livro em linhas gerais pode-se 
propor o que se segue. 

Para grupos independentes: 

• Se a variavel for numerica e tiver distribuigao normal ou aproximadamente normal, ou tiver 
apenas distribuigao simetrica mas a amostra for bastante grande, faga uma analise de 
variancia . 49 

• Se a variavel for ordinal ou, se numerica, mas a distribuiqao nao for simetrica e/ou a amostra 
for pequena, aplique um teste nao parametrico: o teste de Kruskal-Wallis ou o teste da 
mediana, mostrados neste Capitulo. 

Para grupos dependentes: 

• Se a variavel for numerica e tiver distribuigao normal ou aproximadamente normal, ou tiver 
apenas distribuigao simetrica mas a amostra for bastante grande, faga uma analise de 
variancia . 50 

• Se a variavel for ordinal ou numerica, mas a distribuigao nao for simetrica e/ou a amostra for 
pequena, aplique um teste nao parametrico: o teste de Friedman, que veremos neste 
Capitulo. 


4.1. COMPARAgAO DE MAIS DE DOIS GRUPOS INDEPENDENTES 


4.1.1. Teste de Kruskal-Wallis 

O teste de Kruskal-Wallis tambem e conhecido como analise de variancia de Kruskal-Wallis, 
ANOVA de Kruskal-Wallis, ANOVA nao parametrica. 

Indicagao: O teste de Kruskal-Wallis e indicado para comparar tres grupos, como magros, 
saudaveis, obesos, ou mais de tres grupos, como mes da observaqao (janeiro, fevereiro, marqo 
etc.). A variavel em analise deve ser ordinal (como escala visual analogica ou itens de uma 
escala Likert) ou contmua (como peso, tempo, QI). As observaqoes devem ser independentes, 
isto e, as unidades de um grupo nao devem estar relacionadas com as unidades do outro grupo, 
nem devem estar relacionadas entre si. A hipotese em teste e a de que postos dos grupos em 
comparaqao tern a mesma distribuiqao. 

Importante: O teste de Kruskal-Wallis trabalha com postos - nao com dados coletados. Portanto, 
nao testa a hipotese de igualdade de medias da variavel em estudo. 

A logica do teste de Kruskal-Wallis e muito semelhante a do teste de Mann-Whitney. Se voce 
observou k grupos, indique o numero de casos em cada grupo por Uj, n 2 ,... n k . Entao, Uj + n 2 +... + 
n k = n. Para fazer o teste de Kruskal-Wallis: 

Primeiro passo: Estabeleqa a hipotese da nulidade, a hipotese alternativa e o nivel de 
significance. 

Segundo passo : Junte os + n 2 +... + n k = n dados em um so conjunto. Atribua um posto a cada 
dado, sem perder a identificaqao do grupo ao qual cada dado pertence. Os postos vao, portanto, 
de 1 (o dado de menor valor) ate n (o dado de maior valor). Os valores empatados recebem 
postos correspondentes a media dos dos postos que lhes seriam conferidos. 

Terceiro passo: Calcule as somas dos postos das unidades de cada grupo, isto e, 5 R p 5 R 2 ..., 5 R k . 
Se os calculos estiverem corretos, tem-se que: 


+ S /? 2 +-- + X^ 


n +1 
— nx - 


2 


( 4 . 1 ) 


Quarto passo: Se nao houver empates (ou os empates forem poucos), calcule: 

;±A£ + (M + ... + (M 1 _ 3( „ +1 ) 


w(n + l) 


( 4 . 2 ) 








em que 5 R p 5 R 2 ,..., 5 R k sao as somas dos postos das unidades nos grupos 1, 2,..., k, 
respectivamente; n p n 2 ,..., n k representam o numero de unidades nos respectivos grupos; n e o 
numero total de unidades, isto e, rq + n 2 + ...+ rt k . 

Quinto passo: Se a amostra for grande e houver varios grupos em comparaqao, sob a hipotese da 
nulidade a estatrstica H tem, aproximadamente, distribuiqao de J2 com ( k - 1) graus de 
liberdade. Compare, entao, o valor calculado de H com o valor crrtico dado na tabela de y2 
(Tabela 4 do Apendice) ao nivel estabelecido de significancia e com (k - 1) graus de liberdade. 
Rejeite a hipotese da nulidade toda vez que o valor calculado de H for igual ou maior do que o 
valor encontrado na tabela. Se estiver usando um programa para computador, procure o p-valor 
associado a estatrstica H. 

Sexto passo: Para facilitar a comparaqao, calcule as medianas ou as medias dos postos dos 
grupos. 


Exemplo 4.1 

Para avaliar o efeito da expectativa sobre a percepgao da qualidade na degustagao de bebidas, um pesquisador convidou 24 
apreciadores de vinho para uma sessao de degustagao e os dividiu aleatoriamente em tres grupos de mesmo tamanho. 51 Um dos 
participantes do grupo B e dois do grupo C nao compareceram. O tamanho da amostra ficou, portanto, reduzido a 21 
participantes. Aqueles que compareceram foram convidados a avaliar a qualidade de determinado vinho em uma escala visual 
analogica que ia de 0 (pessimo) a 10 (excelente). Cada pessoa fazia uma entrevista individual. Para as pessoas do grupo A se 
induzia a expectativa de um vinho de otima qualidade. Para as pessoas do grupo B se induzia a expectativa de um vinho de baixa 
qualidade e para as pessoas do grupo C nao se faziam previsbes. O vinho era o mesmo. A nota conferida pelos degustadores, 
segundo o grupo ao qual foram designados, e a variavel que sera posta em analise. 

Notas conferidas pelos degustadores segundo o grupo 



Grupo 


A 

B 

C 

6,4 

2,5 

1,3 

6,8 

3,7 

4,1 

7,2 

4,9 

4,9 

8,3 

5,4 

5,2 

8,4 

5,9 

5,5 

9,1 

8,1 

8,2 

9,4 

8,2 


9,7 




Primeiro passo: 

• Hipotese da nulidade: os postos dos grupos em comparaqao sao estatisticamente iguais. 

• Nivel de significancia: ~ T fGfpG para um teste bilateralh 

Segundo passo: Junte os 21 dados em um so conjunto. Atribua um posto a cada dado. O posto 1 



deve ser atribuido para o valor mais baixo (que e 1,3) e o posto 21 para o valor mais alto (que e 
9,7), mas nao perca a identificagao do grupo a que o dado pertence. Os valores empatados 
recebem postos correspondentes a media dos postos que lhes seriam atriburdos. 


Notas conferidas segundo o grupo de degustadores (Tabela auxiliar: postos no 

conjunto) 


Grupo 



Nota 



Posto 


C 



1,3 



1 


B 



2,5 



2 


B 



3,7 



3 


C 



4,1 



4 


B 



4,9 



5,5 


C 



4,9 



5,5 


C 



5,2 



7 


B 



5,4 



8 


C 



5,5 



9 


B 



5,9 



10 


A 



6,4 



11 


A 



6,8 



12 


A 



7,2 



13 


B 



8,1 



14 


B 



8,2 



15,5 


C 



8,2 



15,5 


A 



8,3 



17 


A 



8,4 



18 


A 



9,1 



19 


A 



9,4 



20 


A 



9,7 



21 


Terceiro passo: Para cada grupo, 

calcule as somas dos postos, 

isto e, oRp 

oR 2 e 5 R 3 . 



Notas conferidas segundo o grupo de degustadores (Tabela auxiliar) 



Grupo Nota 

Posto 

Grupo 

Nota 

Posto 

Grupo 

Nota 

Posto 

A 6,4 

11 

B 

2,5 

2 

C 

1,3 

1 

A 6,8 

12 

B 

3,7 

3 

c 

4,1 

4 

A 7,2 

13 

B 

4,9 

5,5 

c 

4,9 

5,5 

A 8,3 

17 

B 

5,4 

8 

c 

5,2 

7 

A 8,4 

18 

B 

5,9 

10 

c 

5,5 

9 

A 9,1 

19 

B 

8,1 

14 

c 

8,2 

15,5 

A 9,4 

20 

B 

8,2 

15,5 




A 9,7 

21 








131 


58 


42 


Para conferir os calculos, lembre-se da formula (4.1). Entao: 

22 

131 + 58 + 42 = 21 Xy = 231 


Quarto passo : Calcule H conforme a formula (4.2): 


H = 


12 

131 2 

21(21 + 1) ) 

8 


■ + -+ - 

7 6 


- 3(21 + 1} 


12 

H = — [2145,125 + 480,5714 + 294 ] - 66 = 9,836 


Quinto passo : Sob a hipotese da nulidade a estatfstica H tern, aproximadamente, distribuiqao de 
y2 com (3 - 1)=2 graus de liberdade. O valor crftico de y2 no nfvel de significancia de 5% e 
com 2 graus de liberdade e 5,99. Rejeite a hipotese de que os postos medios dos tres grupos em 
comparaqao sao estatisticamente iguais. Se usar um programa para computador, obtera p-valor = 
0,0073. 

Sexto passo: Para facilitar a comparaqao, calcule as medias dos postos dos grupos. Obtera: 

• Media dos postos do Grupo A = 16,375 

• Media dos postos do Grupo B = 8,286 

• Media dos postos do Grupo C = 7,000 

Amostras pequenas 

Se houver apenas tres grupos em comparagao e cinco ou menos observagoes em cada grupo, a 
distribuiqao da estatfstica H nao se aproxima, satisfatoriamente, da distribuiqao de %2. Nesses 
casos, voce deve recorrer as tabelas que dao os valores crfticos de H para alguns niveis de 
significancia (Tabela 5 do Apendice). 


Exemplo 4.2 

Foi feito um estudo para verificar se a idade e fator de risco para a gravidade da pneumonia hospitalar em pacientes internados 
em unidade de terapia intensiva (UTI). Foram obtidas as idades de 15 pacientes, classificados em tres grupos segundo a gravidade 
do quadro clinico da pneumonia: moderada, grave, muito grave. Verifique se a idade do paciente e fator de risco para a gravidade 
da pneumonia hospitalar em pacientes na UTI. 

Idade dos pacientes internados em UTI segundo a gravidade do quadro clinico da pneumonia hospitalar 



Grupo 


Moderada 

Grave 

Muito grave 

54 

69 

87 

26 

48 

84 







43 


51 


71 


39 

36 

83 

58 

40 

67 


Primeiro passo: 

• Hipotese da nulidade: os postos medios dos tres grupos em comparagao sao estatisticamente iguais. 

• Nivel de significancia ~ = 0,05, teste bilateral. 

Segundo passo: Junte os 5 + 5 + 5 = 15 dados em um so conjunto. Atribua posto 1 ao valor mais baixo (que e 26) e o posto 15 
para o valor mais alto (que e 87), mas nao perca a identifica^ao do grupo a que o dado pertence. Note que nao houve empates. 
Terceiro passo: Para cada grupo calcule as somas dos postos, isto e, 5 R 1} o R 2 e o R 3 . Para conferir os calculos, lembre-se da 
formula (4.1): 


26 + 30+64 = 15x 


15+1 

2 


= 120 


Idade dos pacientes internados em UTI segundo a gravidade do quadro clinico da pneumonia hospitalar (Tabela auxiliar: postos 

para o teste de Kruskal-Wallis) 


Grupo 

Moderada Grave Muito grave 


Dado 

Posto 

Dado 

Posto 

Dado 

Posto 

54 

8 

69 

11 

87 

15 

26 

1 

48 

6 

84 

14 

43 

5 

51 

7 

71 

12 

39 

3 

36 

2 

83 

13 

58 

9 

40 

4 

67 

10 


5R 3 = 26 


5R 2 = 30 


5R 3 = 64 


Quarto passo: Calcule H, conforme a formula (4.2): 


H = 


12 

15(15 + 1) 


26 2 

5 


+ 


30 2 64 2 

5 5 


-3(15 + 1) = 8,720 


Quinto passo: como a amostra e pequena (sao tres grupos de cinco observances), e melhor recorrer as tabelas que dao os valores 
criticos de H para alguns niveis de significancia (Tabela 5 do Apendice). La voce encontra, para ~ = 0,05 e tres grupos de cinco 
observances (linha em que se Ie 5 5 5), o valor critico 5,780. Rejeite, entao, a hipotese de que a idade de pacientes com 
pneumonia hospitalar, internados em UTI, seja a mesma, qualquer que seja o nivel de gravidade do quadro clinico. 


Se voce usar o programa Statistica 52 vai obter resultados que precisam ser bem examinados 
(toda saida de computador deve ser estudada antes de se chegar a uma conclusao). O valor de H 
(nao ajustado para empates porque nao houve empates) e 8,720, com 2 graus de liberdade. O p- 
valor indica significancia para um teste bilateral. 


Kruskal-Wallis ANOVA by Ranks 






Independent (grouping) variable: idade 

Kruskal-Wallis test: H ( 2, N= 15) = 8,720001 p =,0128 

Code Valid N 

Group 11 5 

Group 2 2 5 

Group 3 3 5 


Sum of Ranks 

26 

30 

64 


Empates 

Fique atento aos empates: se eles ocorreram, a formula (4.2) precisa de uma correqao. Quanto 
menor for a amostra e quanto maior for o numero de empates, mais necessaria sera a correqao. 
Os calculos sao trabalhosos e os programas para computador fazem a corregao automaticamente. 
De qualquer modo, veja como se faz a correqao. E preciso calcular: 


/ 2 , 

i\ . / 2 , 


e, [e t - 1 

Ij + e 2 ye 2 - 1 

) +--- +e '» [e„ ~ 1) 


n(n 2 + l) 


(4.3) 


Nesta formula, me o numero de grupos de empates; e ; (z = 1, 2,..., m) e o numero de valores 
empatados no z-esimo grupo. A estatrstica de teste para o teste de Kruskal-Wallis fica, entao, 
como segue: 

//•=" 

C (4.4) 


Na formula (4.4), H* e a estatrstica, He a estatrstica calculada em (4.2) e C e a correqao 
calculada em (4.3). 


Exemplo 4.3 

Foi feito um ensaio clinico randomizado duplo-cego com pacientes com osteoartrite para comparer o efeito do etoricoxib e do 
naproxeno sobre a dor. Os pacientes foram randomizados para receber placebo (dois comprimidos ao dia) ou etoricoxib (60 mg 
uma vez ao dia) ou naproxeno (500 mg duas vezes ao dia). O estudo durou 12 semanas. Os proprios pacientes avaliaram, a noite, 
a dor que sentiam usando uma escala visual analogica (EVA) (0 = nenhuma dor; 100 = dor extrema). A diferenga entre os 
registros de dor, feitos pelos pacientes no initio e no final do ensaio (diminuiqao da dor), estao na tabela. 


Diminuiijao da dor registrada na EVA considerando initio e final do ensaio 



Grupo 


Placebo 

Etoricoxib 

Naproxeno 

10 

20 

27 

21 

28 

30 


11 


30 


22 




19 


25 


23 


15 

25 

25 

10 

26 

29 

20 

30 

25 


Fonte: Dados ficti'cios, baseados em LEUNG, A.T. et al. Efficacy and tolerability profile of etoricoxib in patients with osteoarthritis: a randomized, 
double-blind, placebo and active-comparator controlled 12week efficacy trial. Curr Med Res Opin 18(2):49-58, 2002. 


Para fazer a corregao no caso de empates, voce ja deve ter atribui'do um posto a cada dado, comegando com o posto 1 para o valor 
mais baixo (que e 10) e terminando com o posto 21 para o valor mais alto (que e 30), sem perder a identificagao do grupo ao qual 
cada dado pertence. No caso dos empates, deve ser atribm'da a media dos postos que eles receberiam na sequencia. Sao m = 4 
grupos de empates. 


Diminuigao da dor registrada na EVA, considerando initio e final do ensaio (Tabela auxiliar: postos) 


Grupo 

EVA 

Posto 

Grupo 

EVA 

Posto 

Grupo 

EVA 

Posto 

Placebo 

10 

1,5 

Placebo 

21 

8 

Etoricoxib 

26 

15 

Placebo 

10 

1,5 

Naproxeno 

22 

9 

Naproxeno 

27 

16 

Placebo 

11 

3 

Naproxeno 

23 

10 

Etoricoxib 

28 

17 

Placebo 

15 

4 

Etoricoxib 

25 

12,5 

Naproxeno 

29 

18 

Placebo 

19 

5 

Etoricoxib 

25 

12,5 

Etoricoxib 

30 

20 

Etoricoxib 

20 

6,5 

Naproxeno 

25 

12,5 

Etoricoxib 

30 

20 

Placebo 

20 

6,5 

Naproxeno 

25 

12,5 

Naproxeno 

30 

20 


I s grupo de empates: 10; 10. Logo e 1 = 2 
2 2 grupo de empates: 20; 20. Logo e 2 = 2 
3 e grupo de empates: 25; 25; 25; 25. Logo e 3 = 4 
4 s grupo de empates: 30; 30; 30. Logo e 4 = 3 


C = 1 - 


2(2 2 - 1) + 2(2 2 - 1) + 4(4 2 - 1) + 3(2 2 - l) 

21 (21 2 + l) 


= 0,989657 


Logo 


. H 12,6141 
~ C ~ 0,989657 


12,745926 


Para o teste de Kruskal Wallis, sem corregao para empates, H = 12,6141. Com corregao para os empates, H* = 12,7459. A 
diferenga nao e grande, mas faga a corregao sempre que dispuser de um programa para isso. 


Medias e medianas 

Quando se aplica um teste de Kruskal-Wallis, nao devem ser apontadas nem medias nem 
medianas dos dados, nem devem ser apresentados graficos com essas estatisticas. Comparam-se 
medias e medianas dos postos. Para deixar isso claro, e apresentado um exemplo bastante 




engenhoso 53 que compara tres grupos com medias e medianas iguais, mas com postos medios 
diferentes. Logo, os grupos sao diferentes. 


Exemplo 4.4 

O resultado do teste de Kruskal-Wallis para os dados apresentados em seguida e significante: H = 7,355, p-valor = 0,0253. No 
entanto, os tres grupos tern a mesma media (43,5) e a mesma mediana (27,5). Entao, apresentar as medias ou as medianas dos tres 
grupos nao mostra que as distribuiqoes sao diferentes. Os postos medios sao diferentes: 34,6; 27,5 e 20,4, respectivamente. 


Grupo 


A 

B 

C 

1 

10 

19 

2 

11 

20 

3 

12 

21 

4 

13 

22 

5 

14 

23 

6 

15 

24 

7 

16 

25 

8 

17 

26 

9 

18 

27 

46 

37 

28 

47 

58 

65 

48 

59 

66 

49 

60 

67 

50 

61 

68 

51 

62 

69 

52 

63 

70 

53 

64 

71 

342 

193 

72 


4.1.1.1.Teste de Dunn para comparagoes muldplas 

Os pesquisadores nao ficam satisfeitos com a conclusao de que as populates amostradas nao 
sao iguais ou de que os tratamentos estudados nao tern, todos, o mesmo efeito. Eles querem saber 
onde estao as diferenqas. Nesses casos, e muito usado o teste de Dunn. 54 

Indicagao: O teste de Dunn compara postos medios de grupos, dois a dois. Nao exige que os 
grupos tenham o mesmo numero de observaqoes, mas tern melhor aproximaqao quando as 
amostras sao grandes. 

Para fazer o teste: 


Primeiro passo: 





Hipotese da nulidade: os grupos em comparagao tern os mesmos postos medios. 55 Estabelega o 
nivel de significancia. 

Segundo passo: Calcule os postos medios dos k grupos. 



em que i = 1,2indica o posto medio do z-esimo grupo. 

Terceiro passo: Calcule o erro padrao para cada par de postos medios. 



(4.5) 


Quarto passo: Calcule as estatrsticas de teste para comparar as medias de postos, duas a duas: 

R,-Rj 

em que z e j indicam o z-esimo e o j-esimo grupo, z = 1, 2 ,...,k,j = 1, 2 ,...k e z \ j. Toda vez que o 
valor calculado de q for maior do que o valor crrtico de q (Tabela 6 do Apendice) no nivel 
estabelecido de significancia e para k grupos, a diferenga entre grupos e significante. 56 Se voce 
estiver usando um programa para computador, procure o p-valor associado a cada diferenga de 
postos medios. 


Empates 


Fique atento aos empates: se eles ocorreram, a formula (4.6) precisa de corregao. Quanto menor 
for a amostra e quanto maior for o numero de empates, mais necessaria sera a corregao. Faga os 
calculos usando um computador, uma vez que os programas ja fazem a corregao 
automatic amente. 

Amostras pequenas 

O teste de Dunn tern melhor aproximagao quando as amostras sao grandes. Quando ha apenas 
tres grupos em comparagao e cinco ou menos observagoes em cada grupo - como acontece no 
exemplo -, recomenda-se fazer a corregao. 57 Nem todo programa para computador faz essa 
corregao especrfica. Entao, procure um programa que a faga. 


Exemplo 4.5 


Reveja o Exemplo 4.2. Para comparar os grupos, dois a dois, aplique o teste de Dunn. 
Primeiro passo: 








• Hipotese da nulidade: os grupos em comparagao tem os mesmos postos medios. 58 

• Hipotese alternativa: pelo menos um grupo tem posto medio diferente. 

• Nivel de significance ~ T fGfph 

Segundo passo: Calcule os postos medios dos tres grupos: 


T 2 = — = 6,0 

5 

— 64 

/? 3 = —= 12,8 

5 


Terceiro passo: Calcule o erro padrao da diferenga de cada dois postos medios, que e dado pela formula (4.5): 


se- pfciS U+J- 


12 M, n, 


Como, neste exemplo, todos os grupos tem o mesmo tamanho, o erro padrao da diferenga de dois postos medios, para todas as 
comparagoes e: 


Quarto passo: Para comparar postos medios dois a dois, calcule as estatisticas de teste pela formula (4.6) e compare com o valor 
critico. Veja a tabela resumo para o teste de Dunn: o posto medio do terceiro grupo e significativamente maior do que os outros 
dois. Entao, pacientes mais velhos internados em UTI tem pneumonia hospitalar mais grave. 


Tabela resumo para o teste de Dunn aos dados apresentados no exemplo 4.1 


Comparagao 

R,-Rj 

q 

q critico 

Conclusao 

Moderada versus grave 

6-5,2 = 0,8 

0,282843 

2,394 

Nao rejeita H ( 

Moderada versus muito grave 

12,8-5,2 = 7,6 

2,687006 

2,394 

Rejeita H 0 

Grave versus muito grave 

12,8-6,0 = 6,8 

2,404163 

2,394 

Rejeita H 0 

Se voce usar o programa SigmaStat para fazer os calculos, obtera: 




All Pairwise Multiple Comparison Procedures (Dunn’s Method) 


Comparison 

Diff of Ranks 


Q 

P<0,05 

Col 3 vs Col 1 

7,600 


2,687 

Yes 

Col 3 vs Col 2 

6,800 


2,404 

Yes 

Col 2 vs Col 1 

0,800 


0,283 

No 


Note: The multiple comparisons on ranks do not include an adjustment for ties. 







4.1.2.Teste da mediana 


Indicagao: O teste da mediana e indicado para testar a hipotese de que tres ou mais populates 
provieram de populates com a mesma mediana. A variavel em analise deve ser ordinal ou 
numerica. 

Importante: O teste da mediana e particularmente util quando existem dados censurados (alguns 
dados estao aquem ou alem dos limites estabelecidos para coleta). 

Para fazer o teste da mediana: 

Primeiro passo: Sejam k grupos com n,, n 2 ,..., n k dados. Estabeleqa as hipoteses e o nivel de 
significance. 

Segundo passo: Junte os k grupos em comparaqao em um so conjunto. Depois, calcule a mediana 
geral desse conjunto de dados. 

Terceiro passo: Conte, em cada grupo, o numero de dados menores ou iguais a mediana e o 
numero de dados maiores do que essa mediana em todos. Arranje as contagens em uma tabela 2 
x k. 


Numero de dados 


Grupo 


12 ... k 


Menores ou iguais a mediana 
Maiores do que a mediana 


Quarto passo: Sob a hipotese de que todos os grupos vieram de populates com a mesma 
mediana, metade dos dados de cada grupo deve ser igual ou menor do que a mediana e metade 
deve ser maior. Aplique o teste de para testar essa hipotese. 59 

Exemplo 4.6 

Para saber se o nivel de estresse e maior em fumantes, em nao fumantes ou em pessoas que deixaram o habito, um pesquisador 
avaliou 30 bancarios usando uma escala validada. Foram retiradas da amostra todas as pessoas que, na ocasiao, estivessem 
enfrentando situaqoes muito estressantes. Como a variavel e ordinal, voce pode aplicar o teste da mediana. 

Nivel de estresse para fumantes,nao fumantes e ex-fumantes 

Grupo 


Fumante 

Nao fumante 

Ex-fumante 

25 

26 

30 

26 

35 

32 

56 

65 

50 

45 

64 

34 

46 

52 

35 



52 


53 


64 


40 

64 

71 

42 

52 

74 

65 

23 

56 

53 

25 

38 


Primeiro passo: A hipotese em teste e a de que os grupos vieram de populates com a mesma mediana. Seja ~ = 0,05. 

Segundo passo: Combine os 10 + 10 + 10 = 30 dados em um so conjunto. Encontre a mediana de todos os 30 dados, que e 48. 

Terceiro passo: Conte, em cada grupo, quantos dados sao menores ou iguais a mediana e quantos sao maiores. Apresente esses 
dados em uma tabela auxiliar, o que facilitara a aplicaqao do teste. 

Tabela auxiliar para proceder ao teste da mediana 


Numero de dados 

Fumante 

Grupo 

Nao fumante 

Ex-fumante 

Menores ou iguais a mediana 

6 

4 

5 

Maiores do que a mediana 

4 

6 

5 

Total 

10 

10 

10 


Quarto passo: Para testar a hipotese de que todos os grupos vieram de populates com a mesma mediana, aplique o teste de yi. 
Nesse exemplo, ^'2 = 0,800. No nivel de significancia ~ = 0,05 e com 2 graus de liberdade, o valor critico de ^'2 e 5,99. Como 
o valor calculado e menor do que 5,99, a hipotese da nulidade nao deve ser rejeitada. 


Se voce usar o programa Statistica para fazer os calculos, obtera o p-valor, que e 0,6706 > 
0,05. 

Median Test, Overall Median = 48,00000 (tempconf.sta) 

Independent (grouping) variable: FUMO 
Chi-Square = ,8000000, df = 2, p = ,6703 




Group 1 

Group 2 

Group 3 

Total 


observed 

6,00000 

4,00000 

5,00000 


<= Median: 

expected 

5,00000 

5,00000 

5,00000 

15,00000 


obs.-exp. 

1,00000 

-1,00000 

0,00000 



observed 

4,00000 

6,00000 

5,00000 


> Median: 

expected 

5,00000 

5,00000 

5,00000 

15,00000 


obs.-exp. 

-1,00000 

1,00000 

0,00000 


Total: 

observed 

10,00000 

10,00000 

10,00000 

30,00000 


Observa^ao: Recomenda-se so aplicar o teste da mediana se a amostra for maior ou igual a 20 e 
houver pelo menos cinco observaqoes em cada grupo. 


4.2. COMPARAgAO DE MAIS DE DOIS GRUPOS DEPENDENTES 


4.2.1.Teste de Friedman 

O teste de Friedman e tambem conhecido como analise de variancia de Friedman, ANOVA de 
Friedman, ANOVA nao parametrica com dois criterios. 

Indicagao: O teste de Friedman e indicado para testar a hipotese de que existe diferenga entre 
mais de dois grupos quando esses grupos sao dependentes. A variavel deve ser ordinal ou 
numerica. 

Para ficar claro o que sao grupos dependentes, veja o Exemplo 4.7. 

Exemplo 4.7 

Imagine que um pesquisador obteve a glicemia de seus pacientes diabeticos antes, durante e depois do tratamento. A observagao 
feita em determinado paciente antes do tratamento esta relacionada com a observagao feita nesse mesmo paciente durante o 
tratamento e com a observagao feita depois do tratamento. Cada paciente constitui um “bloco” de tres dados dependentes. 
Indicamos as tres situagoes por Grupo I (dados de glicemia antes do tratamento), Grupo II (dados de glicemia durante o 
tratamento) e Grupo III (dados de glicemia depois do tratamento). 

Para proceder ao teste de Friedman: 

Primeiro passo: A hipotese da nulidade e a de que nao ha diferenqa entre grupos. Estabeleqa a 
hipotese alternativa e o nivel de significance. 

Segundo passo : Atribua um posto a cada dado por bloco. Reveja o exemplo dos pacientes 
diabeticos cuja glicemia foi obtida antes, durante e depois do tratamento. Nesse exemplo, os 
postos seriam atribuidos por paciente: 1 para o dado com menor valor, 2 para o seguinte, 3 para o 
dado com maior valor. 

Terceiro passo: Calcule as somas dos postos de cada grupo, isto e, 5 R p 5 R 2 , ..., 5 R k . Se as somas 
dos postos estiverem corretas, entao: 


X*.+ X*2+...+ 2*t = j»*(* + l) 


(4.7) 


Quarto passo: Calcule: 


X = 

r 


12 

Nk(k + 1) 



IX+...+ 


I**)—3^(* + l) 


(4.8) 


em que 



N = numero de unidades (p. ex., pacientes); 
k e o numero de grupos. 

Quinta passo: Sob a hipotese da nulidade, a estatistica X 2 tem, aproximadamente, distribuigao 
de X2 com (k ~ 1) graus de liberdade. Faga o teste, que consiste em comparar o valor calculado 
de X 2 com 0 valor crrtico dado na tabela de (Tabela 2 do Apendice), no nrvel de 
significance estabelecido e com (k - 1) graus de liberdade. 

Sexto passo : Para comparagao, calcule as medias dos postos dos grupos. 

Empates 

Fique atento. Quando os empates ocorrem em grupos distintos, a perda de poder e maior. Entao 
nao calcule a estatistica X 2 conforme a formula (4.5). E preciso corregao. 60 Os calculos se 
tornam muito trabalhosos, mas muitos programas para computador fazem essa corregao 
automatic amente. 


Exemplo 4.8 

Para verificar a aprendizagem de seus alunos, um professor de radiologia fez uma perfuragao em uma mandrbula usando broca 
10. Depois, radiografou a mandrbula usando tecnica digital, o que lhe permitiu obter muitas copias. Pediu, entao, a cada um de 
seus oito alunos que examinassem a radiografia no initio, no decorrer e no final do curso. Os alunos nao sabiam que examinavam 
sempre a mesma radiografia e que a resposta correta era “ha lesao” (porque havia uma perfuragao feita com broca 10 na 
mandrbula). Nas tres ocasibes, cada aluno deveria examinar a radiografia que recebia e dizer: 

a) nao ha lesao; 

b) provavelmente nao ha lesao; 

c) provavelmente ha lesao; 

d) ha lesao. 

Para a analise, o professor conferiu notas a cada resposta de cada aluno de acordo com o criterio: 

a) zero: nao ha lesao; 

b) 1: provavelmente nao ha lesao; 

c) 2: provavelmente ha lesao; 

d) 3: ha lesao. 


Aluno 


A 

B 

C 

D 


Notas dadas pelos alunos segundo o grupo (perrodo do curso) 


Grupo 

Infcio Durante Final 

0 13 

0 12 

0 2 3 

1 0 3 


E 


1 


2 


3 


F 


0 


3 


2 


G 

H 


0 

3 


1 3 

0 1 


As notas que voce precisa comparer estao relacionadas entre si, porque sao dadas pelo mesmo aluno em tres periodos distintos do 
curso. Vamos, entao, aplicar o teste de Friedman. 

Primeiro passo: A hipotese da nulidade e a de que nao ha diferenga na avaliagao dos alunos no inicio, no decorrer e no final do 
curso. Seja ~ = 0,05. 

Segundo passo: Atribua um posto a cada dado por linha. Os postos, em cada linha, vao de 1 (o dado de menor valor) a 3 (o dado 
de maior valor). Valores empatados recebem, como posto, a media dos postos que lhes seria conferido. 

Terceiro passo: Para cada grupo, calcule a soma dos postos, isto e, oftj, 5 R 2 e 5R 3 . Depois, verifique os calculos, aplicando (4.5), 
lembrando que N e o numero de alunos (numero de linhas) e k e o numero de grupos (periodos em que os alunos foram 
avaliados). Entao, N = 8 e k = 3. Para o exemplo: 

11+ 15+ 22 = 1(8x3x4)= 48 


Notas dadas pelos alunos segundo o grupo (Tabela auxiliar para proceder ao teste de Friedman) 


Aluno Grupo 

Inicio Durante 



Dado 

Posto 

Dado 

Posto 

Dado 

A 

0 

1 

1 

2 

3 

B 

0 

1 

1 

2 

2 

C 

0 

1 

2 

2 

3 

D 

1 

2 

0 

1 

3 

E 

1 

1 

2 

2 

3 

F 

0 

1 

3 

3 

2 

G 

0 

1 

1 

2 

3 

H 

3 

3 

0 

1 

1 



5Rj = 11 


5R 2 = 15 


Quarto passo: Calcule ^ r 2 

conforme a formula (4.6), transcrita aqui: 





* 2= NkVc+ 1)[(Z R 0 


-0)1 

— 3/V(fc + 1) 


Final 


Posto 

3 

3 

3 

3 

3 

2 

3 

2 


5R 3 = 22 


Neste exemplo, N = 8 alunos (linhas) ek = 3 grupos (colunas). 

* 2 ■ S.i.’dl) 1(11)2 * [15)2 * (22)21 - 3 “ 8 - < 3 *D 
, l r 

X 2 = -[121 + 225 + 484 ] - 96 = 7,75 
8 


Quinto passo: Como o valor calculado de y r 2 de Friedman e maior do que yj- 


5,99, valor critico com dois graus de liberdade 




e no nivel de 5% de significancia dado na Tabela 2 do Apendice, o professor pode afirmar que o grau de conhecimento de seus 
alunos mudou. 

Sexto passo: As medias dos postos de cada grupo dao ideia do padrao de diferengas: 

• inicio do curso: media 1,375; 

• durante o curso: media 1,750; 

• final do curso: media 2,750. 


Se voce usar o programa Statistica para fazer os calculos, obtera: 

Friedman ANOVA and Kendall Coeff. of Concordance (notas.sta) 

ANOVA Chi Sqr. (N = 8, df = 2) = 7,750000 p < ,02076 
Coeff. of Concordance = ,48438 Aver, rank r = ,41071 

Average Sum of 



Rank 

Ranks 

Mean 

Std.Dev. 

Antes 

1,375000 

11,00000 

,625000 

1,060660 

Durante 

1,875000 

15,00000 

1,250000 

1,035098 

Depois 

2,750000 

22,00000 

2,500000 

,755929 


Amostras pequenas 

Quando as amostras sao pequenas, a distribuigao da estatfstica % T 2 nao se aproxima, 
satisfatoriamente, da distribuigao de %2. Se k = 3 e N varia entre 2 e 9, oil k = 4 e N varia entre 2 
e 4, use a Tabela 9 do Apendice. No entanto, muitos programas para computador usam, mesmo 
nesses casos, a aproximagao normal e fornecem o p-valor. 

4.2.1.1. Teste de Dunn para comparagoes muldplas 

Se os dados permitem concluir que as populates amostradas ou os tratamentos estudados nao 
sao iguais, e logico buscar saber onde estao as diferengas. E preciso, entao, um procedimento 
para fazer as comparagoes multiplas ou, melhor ainda, comparar os postos medios dois a dois. 
Nesses casos, e muito usado o teste de Dunn. 

Para fazer o teste de Dunn: 

Primeiro passo: A hipotese da nulidade e a de que os grupos em comparagao tern os mesmos 
postos medios. 61 Estabelega a hipotese alternativa e o nivel de significancia. 

Segundo passo: Calcule o desvio padrao s 


S — 


bk(k + 1) 


(4.9) 


Nessa formula, be o mimero de unidades (p. ex., pacientes) em comparagao eke o numero de 




grupos. 

Terceiro passo: Calcule as estatisticas de teste para comparar as somas dos postos duas a duas: 

ft - ft 

9 =- 

5 (4.10) 

em que R t e Rj indicam a soma dos postos dos z'-esimo e j-esimo grupos, z = 1, 2 = 1,2, ...k e 
z 4 j■ A diferenqa entre grupos e significante toda vez que o valor calculado de q for maior do que 
o valor critico de q (Tabela 6 do Apendice), no nivel estabelecido de significancia e com k 
grupos. 62 Se voce estiver usando um programa para computador, procure o p-valor associado a 
cada diferenqa de postos medios. 


Exemplo 4.9 

Reveja o Exemplo 4.7. Os alunos examinaram a radiografia no initio, no decorrer e no final do curso e deram respostas. O 
conhecimento deles sobre o assunto melhorou? 

Primeiro passo: A hipotese em teste e a de que os grupos em compara^ao tern o mesmo posto medio. Seja 5% o nivel de 
significancia. 

Segundo passo: Calcule o desvio padrao dos dados conforme a formula (4.9): 


bk(k + 1) |8 x 3 x (3 + 1) 


= 4 


Terceiro passo: Calcule as estatisticas de teste para comparar as somas dos postos, duas a duas, conforme a formula (4.10). 
Organize os resultados em uma tabela-resumo para o teste de compara^oes multiplas. Compare o valor calculado com o valor 
critico, para tres tratamentos e no nivel de significancia de 5%. 


Tabela-resumo para o teste de comparaijoes multiplas,exemplo 4.6 


Compara^ao 

\Ri-Rj\ 

Valor calculado de q 

Valor critico de q 

Conclusao 

Inicio versus durante 

|11 — 15| = 4 

1 

2,394 

Nao rejeita H ( 

Inlcio versus final 

|11 — 22| = 11 

2,75 

2,394 

Rejeita H 0 

Durante versus final 

115 — 22| = 7 

1,75 

2,394 

Nao rejeita H ( 


Os alunos apresentaram melhor conhecimento sobre o assunto quando terminaram o curso, em compara^ao com o que sabiam no 
initio. 









RESUMO E OBJETIVO DO CAPITULO 


Lido este Capitulo, voce devera ser capaz nao so de aplicar os testes apresentados, como tambem 
de saber por que foram aplicados. Foram apresentadas duas situagoes que admitem o uso de 
estatistica nao parametrica: 

1. Comparagao de grupos independentes. Foram apresentados o teste de Kruskal-Wallis e o 
teste da mediana. As comparagoes multiplas podem ser feitas pelo teste de Dunn, que tem 
no teste de Tukey seu equivalente parametrico. 

2. Comparagao de mais de duas amostras dependentes. Foi apresentado o teste de Friedman. 


49 Veja o procedimento para analise de variancia em VIEIRA, S. Analise de variancia. Sao Paulo: Atlas, 2006. 

50 Id., ibid. 

51 The Kruskal-Wallis Test for 3 or More Independent Samples. Disponivel em: http://vassarstats.net/textbook/chl4a.html. 
Acesso em 3 de novembro de 2017. 

52 StatSoft, Inc. 2300 East 14th Street, Tulsa, OK 74104, USA. 

53 MCDONALD, JH. Handbook of Biological Statistics. 2 nd ed. Baltimore: Sparky House Publishing, 2009. p. 165-172. 

54 Alguns dizem que o teste de Dunn e o equivalente nao parametrico do teste de Tukey. 

55 Com base em ZAR, JH. Biostatistical Analysis. 4 th ed. Upper Saddle River, New Jersey: Prentice Hall, 1999. p. 224-225. 

56 O valor de q e o valor de z da distribui^ao normal padronizada que tem, a sua direita, a area ~/k (k-1). E uma corregao baseada 
na desigualdade de Bonferroni. Veja: 

DANIEL, WW. Applied Nonparametric Statistics. 2 nd ed. Pacific Grove: Duxbury, 2000. p. 241. 

57 Veja HOLLANDER, M.E.; WOLFE, D.A. Nonparametric Statistics Methods. Nova York: Wiley, 1973. 

58 Com base em ZAR, JH. Biostatistical Analysis. 4 th ed. Upper Saddle River, New Jersey: Prentice Hall, 1999. p. 224-225. 

59 Veja o teste de %2 para tabelas 2 x k no Capitulo 6 deste livro. 

60 Veja, por exemplo, CONOVER, W.J. Practical Nonparametric Statistics. 2 nd ed. New York: Wiley, 1980. 

61 Com base em ZAR, J.H. Biostatistical Analysis. 4 th ed. Upper Saddle River, New Jersey: Prentice Hall, 1999. p. 224-225. 

62 O valor de q e o valor de z da distribuigao normal padronizada que tem, a sua direita, a area ~/k (k-1). E uma correqao baseada 
na desigualdade de Bonferroni. Veja: 

DANIEL, WW. Applied Nonparametric Statistics. Pacific Grove: Duxbury, 1990. p. 241. 




womens mais anos lem imras nervosas mais iongas. u possivei que o comprimento aos nervos sensonais esteja 
diretamente relacionado com a vulnerabilidade. Para saber se as estaturas de homens com pe diabetico sao maiores, foi 
medida a estatura de homens de tres grupos: nao diabeticos (grupo controle), diabeticos e diabeticos com problemas no pe 
ou grupo de pe diabetico. Como a amostra e pequena, compare as estaturas dos tres grupos usando o teste de Kruskal- 
Wallis. 


Tabela 4.1 - Estatura, em metros, de nao diabeticos (controle),diabeticos e grupo com pe diabetico 

Grupo 


Controle 

Diabetico 

Pe diabetico 

1,75 

1,74 

1,77 

1,70 

1,76 

1,89 

1,69 

1,68 

1,84 

1,82 

1,80 

1,81 

1,78 

1,79 

1,73 

Fonte: BRESATER, L.E., WELIN, L., ROMANUS, B. Foot pathology and risk factors for diabetic foot disease 
Pract 32(1-2): 103-109, 1996. 

in elderly men. Diabetes Res Clin 

4.3.2. Sao dados 63 os escores de um coeficiente de desempenho verbal para tres grupos etnicos. Faga o teste de Kruskal-Wallis. 

Tabela 4.2 

- Escores do coeficiente de desempenho verbal segundo o grupo etnico 

Etnia 

Negro 

Latino 

Branco 

1 

4 

2 

3 

5 

3 

6 

12 

5 

7 

13 

8 

9 

15 

10 

10 

17 

12 

11 

22 

14 

16 

27 

18 

20 

29 

23 

21 

30 

25 


Fonte: GIBBONS, J.D. Nonparametric Statistics. Newbury Park: Sage Publications, 1993. 


4.3.3. Na Tabela 4.3 voce encontra o pH de 12 amostras de cada uma de quatro marcas de refrigerante disponiveis no comercio. 
Cada amostra foi tomada em 1 litro da bebida. Faga o teste da mediana. 

Tabela 4.3 - O pH do refrigerante segundo a marca 

Marca 


A 

B 

C 

D 

7,1 

6,9 

7,8 

6,4 

7,2 

7,0 

7,9 

6,6 


7,4 

7,1 

7,6 

7,2 

7,6 

7,3 

7,7 

7,3 

7,7 

7,4 

7,9 

7,6 

8,1 

7,8 

8,4 

8,1 

8,5 

8,3 

8,8 

8,5 


8,1 

6,7 

8,3 

7,1 

8,3 

7,6 

8,4 

7,8 

8,4 

8,2 

8,4 

8,4 

8,6 

8,6 

8,9 

8,7 

9,2 

8,8 

9,4 

8,9 


4.3.4. Em uma pesquisa, 64 10 criticos de arte classificaram quatro pinturas segundo uma escala que variava entre 0 
(definitivamente, nao gosto) e 5 (definitivamente, gosto muito). A Tabela 4.4 apresenta os valores atribui'dos segundo o 
critico de arte para cada pintura. Faga o teste de Friedman. 

Tabela 4.4 - Valores atribuidos segundo o critico de arte para cada pintura 


Critico de arte 



Pintura 



A 

B 

C 

D 

1 

0 

5 

1 

4 

2 

3 

4 

2 

5 

3 

1 

4 

3 

4 

4 

4 

2 

2 

3 

5 

2 

2 

4 

3 

6 

0 

3 

5 

5 

7 

3 

1 

3 

4 

8 

5 

3 

1 

5 

9 

1 

5 

2 

4 

10 

2 

4 

0 

3 


4.3.5. No exemplo 4.2 e relatado um ensaio clinico randomizado placebo-controlado duplo-cego conduzido com pacientes com 

osteoartrite para testar o efeito do etoricoxib sobre a dor e comparar o efeito desse medicamento com o do naproxeno. 
Fa^a o teste da mediana. 

4.3.6. Os postos apresentados 65 em seguida resultam em um teste de Kruskal-Wallis significante. Aplique o teste de Dunn para 

determinar entre quais grupos populacionais existe diferenga estatistica. 

Grupo A: 8; 4; 3; 5; 1 
Grupo B: 10; 6; 9; 11; 2 
Grupo C: 14;13;7;12;15 

4.3.7. Na Tabela 4.5 sao apresentados os niveis de cortisol de tres grupos de pacientes cujos partos ocorreram entre 38 e 42 

semanas de gestagao. O Grupo I foi estudado antes do inicio da cesarea eletiva, o Grupo II foi estudado durante o trabalho 
induzido de parto por cesarea e o Grupo III foi estudado durante o trabalho de parto espontaneo. Esses dados trazem 


evidencia suficiente que permita dizer que existe diferenga entre grupos no nivel de 1% de significancia? 


Tabela 4.5 - Nivel de cortisol de tres grupos de pacientes em trabalho de parto 

Grupo 


I 

II 

III 

262 

465 

343 

307 

501 

772 

211 

455 

207 

323 

355 

1.048 

454 

468 

838 

339 

362 

687 

304 



154 



287 



356 




Fonte: CAWSON, M.J.; ANDERSON, A.B.M.; TURNBULL, A.C.; LAMPE, L. Cortisol, cortisone, and 11-deoxycortisol levels in human 
umbilical and maternal plasma in relation to the onset of labour. J Obstet Gynaecol Br Commonw 81(10): 737-745, 1974. 

4.3.8. A Tabela 4.6 apresenta os escores de desempenho verbal de criangas quando ingressam na escola e vem de diferentes 
comunidades. Faga o teste da mediana. 

Tabela 4.6 - Escores de desempenho verbal de criangas quando ingressam na escola segundo a comunidade da qual provieram 



Comunidade 



Muito isolada 

Isolada 

Rural 

Favela 

21 

33 

36 

41 

22 

27 

35 

43 

22 

29 

33 

44 

20 

29 

35 

37 

25 

26 

39 

36 

28 

29 

37 

36 

22 

26 

30 

42 

23 

35 

33 

32 

20 

33 

35 

43 

44 

34 

35 

25 

27 

36 

27 

25 

30 

40 

42 

38 

30 

45 

26 

34 

22 

34 

36 

42 

21 

26 

30 

40 

25 

34 

39 

45 

21 

33 

30 

37 


23 


33 

37 

28 

32 

39 

24 

42 

33 

40 

28 

40 

42 

34 

36 

41 

44 

41 

45 


Fonte: DANIEL, W.W. Applied Nonparametric Statistics. 2 nd ed. Pacific Grove: Duxbury, 2000. p. 252-253. 

4.3.9. Para comparar tres metodos de determinagao de amilase serica de pacientes com pancreatite, foram obtidos os valores 
apresentados na Tabela 4.7. Faqa o teste de Friedman e as comparagbes multiplas. 

Tabela 4.7 - Valores de amilase serica (unidades de enzima por 100 mL de soro)de pacientes com pancreatite 


Paciente 


Metodo de determina^ao 



A 

B 

C 

1 

4.000 

3.210 

6.210 

2 

1.600 

1.040 

2.410 

3 

1.600 

647 

2.210 

4 

1.200 

570 

2.060 

5 

840 

445 

1.400 

6 

352 

156 

249 

7 

224 

155 

224 

8 

200 

99 

208 

9 

184 

70 

227 


Fonte: HALL, F.F. et al. An improved amylase assay using a new starch derivative. Am J Clin Pathol 53(5): 627634, 1979. Apud DANIEL, W.W. 
Applied Nonparametric Statistics. 2 nd ed. Pacific Grove: Duxbuty, 2000. p. 265. 

4.3.10. A Tabela 4.8 apresenta os valores de bilirrubina em 10 bebes normals, medidos em idades diferentes. Esses dados trazem 
evidencia suficiente que permita dizer que o nivel de bilirrubina decresce entre os 4 e os 10 dias de idade? Faqa o teste de 
Friedman. 


Tabela 4.8 - Valores de bilirrubina em 10 bebes normals segundo a idade 

Niimero Grupo de idade (em dias) 


4 

7 

10 

10,8 

5,0 

2,6 

12,5 

11,0 

6,0 

13,7 

15,6 

10,6 

11,5 

3,5 

1,6 

10,2 

3,0 

2,0 

8,0 

7,0 

3,0 

10,8 

7,0 

5,6 

14,9 

9,4 

7,6 

16,2 

10,2 

7,4 


9 


10 


10,8 


4,6 


3,5 


Fonte: STERN, L., KHANNA, N.N., LEVEY, G., YAFFE, S.J. Effect of phenobarbitol on hyperbilirubinemia and glucuronide formation in 
newborns. Am J Dis Child 120 (1): 26-31, 1970. Apud DANIEL, W.W. Applied Nonparametric Statistics. 2 nd ed. Pacific Grove: Duxbury, 2000. 


63 GIBBONS, J.D. Nonparametric Statistics. Newbury Park: Sage Publications, 1993. 

64 Dispomvel em https://secure.brightstat.com/index.php?p=c&d=l&c=2o. Acess em 6 de novembro de 2017. 

65 ZAR, J.H. Biostatistical Analysis. 4 th ed. Upper Saddle River, New Jersey: Prentice Hall, 1999. p. 230. 
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Tabelas 2x2 



Uma tabela de contingencia (tambem conhecida como tabela cruzada ou tabela de dupla entrada) 
e um arranjo de dados classificados de acordo com duas variaveis qualitativas ou categorizadas. 
Uma das variaveis e apresentada nas linhas e a outra, nas colunas. Cada celula apresenta a 
frequencia de casos para um par especrfico de categorias de cada uma das variaveis. 


Exemplo 5.1 

Imagine que um pesquisador quer saber se a opgao de jogar lixo nas ruas ou levar o lixo as lixeiras disponiveis em locais publicos 
esta associada ao sexo. Esse pesquisador observa 100 pessoas e registra o sexo e a opqao para a forma como essa pessoa descarta 
o lixo. Os dados obtidos sao apresentados em uma tabela, denominada tabela de contingencia. 


Distribuiqao das pessoas segundo o sexo e a opqao para descarte de lixo 


Sexo 


Descarte de lixo 



Lixeira 


Rua 

Mulheres 

18 


7 

Homens 

42 


33 


Neste capitulo, vamos estudar as tabelas 2x2, que sao uma das maneiras mais comuns de 
apresentar evidencia estatistica. No caso dessas tabelas, e usual aplicar o teste de qui-quadrado 
para testar a hipotese de associagao das variaveis (como no Exemplo 5.1, saber se a opqao para a 
forma de descartar o lixo esta associada ao sexo) ou a hipotese de igualdade de proporgdes, 
como veremos adiante. 

As hipoteses sao redigidas de maneira diferente porque as frequencias exibidas nas tabelas 2 x 
2 sao obtidas por diferentes procedimentos de pesquisa: estudos transversais, estudos 
retrospectivos, estudos prospectivos e ensaios clinicos. Vamos entender esses procedimentos por 
meio de exemplos. 

Estudos transversais sao feitos para testar a hipotese de que duas variaveis estao associadas. 
Pesquisadores obtem uma amostra de tamanho n de uma grande populaqao e classificam cada 
individuo amostrado segundo as duas variaveis de interesse, simultaneamente. Quando essas 
variaveis sao apenas duas (p. ex., as caracteristicas A e B) e binarias (Sim e Nao), os dados sao 
obtidos como mostra esquematicamente a Figura 5.1. 

Na apresentaqao dos dados obtidos em estudos transversais, e recomendavel fornecer nao 
apenas as frequencias, mas tambem as proporqoes - ou as porcentagens - em cada celula. As 
proporqoes sao obtidas dividindo-se as frequencias observadas pelo tamanho da amostra, 
indicado por n. Para obter a porcentagem, e so multiplicar a proporqao por 100. 




Avaliagao simultanea da 
caracteristica A e caracteristica B 


'r 



Figura 5.1 - Estudo transversal 


Exemplo 5.2 

Perguntou-se, a cada uma de 200 criangas de pre-escola, se elas gostavam mais de gato ou de cachorro e, com a resposta, anotou- 
se o sexo da crianga. As respostas foram, portanto, classificadas de acordo com duas variaveis categorizadas: sexo (masculino ou 
feminino) e animal preferido (gato ou cachorro). Os dados obtidos foram: 

• 51 meninas preferiam gato. 

• 42 meninas preferiam cachorro. 

• 50 meninos preferiam gato. 

• 57 meninos preferiam cachorro. 

Esses dados sao arranjados em uma tabela de contingencia. 


Sexo 


Animal preferido 



Gato 


Cachorro 

Masculino 

50 (0,250) 


57 (0,285) 

Feminino 

51 (0,255) 


42 (0,210) 


Nos estudos retrospecdvos, os participantes provem de duas populates diferentes: os que 
tern determinada caracteristica (casos) e os que nao tern essa caracteristica (controles). Uma 
amostra de pessoas de cada populaqao e examinada para determinar a proporqao dos que foram 














expostos a determinado fator que se presume de risco. 

Por exemplo, pesquisadores amostram rq pessoas com uma doenga cardiovascular e n 2 
pessoas sem essa doenga. Os dois grupos devem ser em tudo comparaveis exceto pelo fato de, 
em um deles, as pessoas terem a doenga e no outro, nao. Depois, os pesquisadores estudam a 
historia pregressa das pessoas para obter a proporgao, tanto no grupo de doentes como no grupo 
de nao doentes, de pessoas que foram expostas a um fator que eles presumem de risco, como o 
sedentarismo, por exemplo. Veja a Figura 5.2. 



Figura 5.2 - Estudo retrospective). 


Nos estudos retrospectivos, e recomendavel fornecer as proporgoes (ou porcentagens) que 
estao sendo comparadas ja na apresentagao dos dados. Veja o exemplo 5.3, que e classico, 
porque foi a primeira vez que se apresentou esse procedimento de pesquisa. 


Exemplo 5.3 

Foi feito um estudo retrospectivo para saber se cancer no pulmao ocorre mais em fumantes. Foram entrevistados dois grupos de 
pessoas que estavam sendo atendidas em hospitals de Londres e cidades vizinhas para conhecer seus habitos de fumar: um grupo 
de 649 pessoas tinha cancer no pulmao (os casos) e outro grupo, de 649 pessoas comparaveis, nao tinha cancer de pulmao (os 
controles). Dos casos, 27 eram fumantes; dos controles, 2 eram fumantes. 















Participantes da pesquisa segundo ter ou nao cancer de pulmao e ser ou nao fumante 


Cancer no pulmao 

Habito de fumar 

Total 

Porcentagem de fumantes 


Sim 

Nao 



Presente 

27 

622 

649 

4,16 

Ausente 

2 

647 

649 

0,308 

Total 

29 

1.269 

1.298 



Fonte: DOLL, R.; HILL, A.B. Smoking and carcinoma of the lung. Br Med J 2: 739-48, 1950. 


Os estudos retrospectivos sao pouco confiaveis porque neles se pede que as pessoas relatem 
fatos do passado, que podem ser sobrevalorizados se as pessoas suspeitarem de que tais fatos 
explicam as condiqoes em que elas estao no presente. Para compensar essa desvantagem, 
recomenda-se que esses estudos sejam feitos com grandes amostras. No entanto, isso demanda 
tempo e dinheiro. Entao os estudos retrospectivos sao, muitas vezes, feitos com poucos dados, o 
que os torna rapidos e baratos - mas, por conta disso, pouco confiaveis. 

Nos estudos prospectivos, tambem chamados coortes, os participantes provem de duas 
populates diferentes: os que estao expostos a determinado fator que se presume de risco para 
determinado desfecho e os que nao estao expostos a esse fator. Pesquisadores acompanham uma 
amostra de rq pessoas expostas a esse fator e uma amostra de n 2 pessoas nao expostas, durante 
tempo relativamente longo. Terminado o periodo de observaqao, calcula-se a proporqao de 
pessoas com o desfecho procurado em cada uma das amostras. Veja a Figura 5.3. 

Como exemplo, imagine que pesquisadores amostram rq pessoas sedentarias e n 2 pessoas nao 
sedentarias para saber se o sedentarismo aumenta o risco de doenqa cardiovascular. Os dois 
grupos devem ser em tudo comparaveis exceto pelo fato de, em um deles, as pessoas serem 
sedentarias e no outro, nao. Depois de um periodo relativamente longo, os pesquisadores 
determinam a proporqao de pessoas com a doenqa nas duas amostras. 

Nos estudos prospectivos e recomendavel apresentar, nas tabelas 2x2 que contem os dados, 
as proporqoes que estao sendo comparadas. Veja o Exemplo 5.4. 


Exemplo 5.4 

Pesquisadores acompanharam dois grupos de mulheres em periodo de gestagao ate o parto: o primeiro grupo era constituido por 
diabeticas e o segundo, por nao diabeticas, pois se suspeita que o obito neonatal ocorra mais quando a mae e diabetica. Os 
pesquisadores contaram o numero de casos de obito neonatal tanto no grupo de diabeticas como no grupo de nao diabeticas. Os 
dados obtidos e as proporgoes em comparagao estao apresentados em uma tabela 2x2. 

Obito neonatal segundo o fato de a mae ter ou nao diabetes melito 

Diabetes melito Obito neonatal Total Porcentagem de obitos neonatais 

Sim Nao 


Portadoras 


3 


21 


24 


12,50% 




Nao portadoras 

21 

830 

851 

2,47% 

Total 

24 

851 

875 



Fonte: CUNHA, A.A, PORTELA, M.C., AMED, A.M., CAMANO, L. Diabetes mellitus tipo 1 (insulinodependente) e gravidez: conduta obstetrica 
e resultado perinatal. GoAtual 5(6): 24-26, 2001. 
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Figura 5.3 - Estudo prospectivo. 


Para fazer um ensaio clmico randomizado e controlado, o pesquisador divide uma amostra de 
n pacientes ao acaso em dois grupos: um grupo de rq pacientes recebe o tratamento em teste 
(grupo tratado) e o outro, de n 2 pacientes, constitui o controle (controle positivo se os pacientes 
receberem um tratamento convencional e controle negativo se os pacientes receberem um 
placebo). Se o desfecho do tratamento so puder ser “sim” ou “nao”, os dados do ensaio sao 
apresentados em uma tabela 2x2. Veja a Figura 5.4. 

Como os ensaios clinicos sao feitos para comparar grupos, e recomendavel fornecer as 
proporqoes com respostas positivas dos dois grupos quando se apresentam os dados. Veja o 
Exemplo 5.5. 
















Amostra 




Figura 5.4. Estudo clrnico. 


Exemplo 5.5 

Pacientes em UTI com ventila^ao mecanica correm risco de desenvolver pneumonia aspirativa, causada pelo refluxo do alimento 
e pela consequente aspiragao. Em um ensaio clinico para verificar se a nutriqao enteral esteril diminui a colonizaqao microbiana 
do estomago do paciente em ventila^ao mecanica, o grupo controle recebeu dieta enteral regular e o grupo tratado recebeu a dieta 
em teste. Dos 20 tratados, 3 tiveram pneumonia aspirativa; dos 20 controles, 2 tiveram pneumonia aspirativa. 


Incidencia de pneumonia aspirativa segundo o grupo 


Grupo 

Pneumonia aspirativa 

Total 

I’ropoK.io com pneumonia 


Sim 

Nao 



Tratado 

3 

17 

20 

0,150 

Controle 

2 

18 

20 

0,100 

Total 

5 

35 

40 



Fonte: DAVID, C.M.; GOLDWASSER, R.; GONTIJO FILHO, P.P. A nuti igao enteral esteril diminui a colonizagao microbiana do estomago do 
paciente em ventila^ao mecanica. Rev Bras Terap Intens 10(1): 12-28, 1998. 





















5.1. TESTE DE yl DE PEARSON 

Indicagao: O teste de x2 de Pearson serve para testar a hipotese de que duas variaveis 
categorizadas sao independentes. 66 O srmbolo x e uma letra grega de nome qui; 67 le-se teste de 
qui-quadrado porque x esta elevado ao quadrado (a segunda potencia). 

Para fazer o teste de x2 de Pearson: 

Primeiro passo: Escreva a hipotese da nulidade, de que as variaveis sao independentes. 
Estabeleqa o nivel de significancia. 

Segundo passo: Apresente os dados em uma tabela 2x2. Calcule os totais marginais e o total 
geral, como mostrado na Tabela 5.1. Os totais estao em negrito. 


Tabela 5.1 - Valores literals em uma tabela 2x2 


Variavel A 


Variavel B 


Total 


Nao 


Sim 


Nao 

a 


b 

a + b 

Sim 

c 


d 

c + d 

Total 

a + c 


b + d 

n 


Terceiro passo: Calcule a estatistica de teste, que esta associada a 1 grau de liberdade. 




{ad - be ) 2 n 

(a+b)(c + d)(a + c){b+d) 


(5.1) 


Quarto passo: Compare o valor calculado de x2 que esta associado a 1 grau de liberdade com o 
valor critico, no nivel de significancia estabelecido (Tabela 2 do Apendice). Rejeite a hipotese da 
nulidade toda vez que o valor calculado de x2 for igual ou maior do que o valor critico. Se voce 
estiver usando um programa de computador para fazer os calculos, vai obter o p-valor. 

Exemplo 5.6 

Para estudar a associagao entre correr mais de 25 km/semana e ter dor nos joelhos, imagine que pesquisadores fizeram um estudo 
transversal com 1.455 universitarios. Dos 1.000 que nao tinham dor nos joelhos, 215 nao corriam mais de 25 km/semana. Dos 
455 que tinham dor no joelho, 75 nao corriam mais de 25 km/semana. Para fazer o teste de de Pearson: 

Primeiro passo: A hipotese da nulidade e a de que a dor nos joelhos nao depende de correr mais de 25km/semana. Estabele^a o 
nivel de significancia de 0,05. 

Segundo passo: Apresente os dados em uma tabela 2 x 2 e calcule os totais marginais e o total geral. 

Participantes da pesquisa segundo o fato de ter dor nos joelhos e correr mais de 25 km/semana 


Corre mais de 


Tem dor nos joelhos 


Total 



25 km /semana 

Nao 

Sim 


Nao 

215 

75 

290 

Sim 

785 

380 

1.165 

Total 

1.000 

455 

1.455 


Fonte: http://www.theanalysisfactor.com/difference-between-chi-square-test-and-mcnemar-test/ 

Terceiro passo: Calcule a estatfstica de teste usando a formula (5.1): 

2 _ (215 x 380 -75 x 785) 2 x 1455 

X ~ (215 + 75 ) x (785 + 380) x (215 + 785 ) x (75 + 380) 

(22825) 2 x 1.455 758026809375 

-----= -= 4931 

290 x 1.165 x 1.000 x 455 153721750000 ’ 

Quarto passo: Compare o valor calculado de x2 (4,931), que esta associado a 1 grau de liberdade, com o valor critico de x2 no 
m'vel de significancia de 0,05 (Tabela 2 do Apendice). O valor critico e 3,84. Como o valor calculado de x2 e maior do que o 
valor critico, a conclusao e a de que, no nivel de 5% de significancia, dores no joelho estao associadas ao fato de correr mais de 
25 km/semana. 

Se voce estiver usando um programa de computador para fazer esses calculos, vai encontrar p-valor = 0,026377. 


Exigencias para a aplica^ao do teste 

1. Independence. as caracteristicas estudadas devem ser independentes, como, por exemplo, 
um grupo e constituido por homens, outro por mulheres e se pergunta a eles se fumam ou 
nao fumam. 

2. Tamanho da amostra : 68 a amostra deve ter tamanho maior do que 20 (n > 20) e as 
frequences marginais nao podem ser pequenas. 


5.1.1. Corregao de continuidade 

Muitos estatisticos recomendam, nos casos de uma tabela 2x2, calcular o valor de /2 de 
Pearson com corregao de continuidade. A estatistica, conhecida como x2 com corregao de Yates, 
e: 


X 2 = 


ad - be 


(a+ b )(c + dXa +c)(b+d) 


(5.2) 


e esta associada a (2 -1) (2 - 1) = 1 grau de liberdade. 

A correqao de continuidade produz um teste mais conservador, isto e, um teste com menor 
probabilidade de rejeitar a hipotese da nulidade. 69 Se a amostra for pequena, o efeito da correqao 
de continuidade sera ainda maior. 






Os programas para computador fornecem o valor de x2 tanto para o teste com correqao de 
continuidade como sem correqao, bem como os respectivos p-valores. E preste muita atenqao 
porque isto acontece: voce aplica o teste de /2 para testar a independence de duas variaveis a 
determinado conjunto de dados e, sem a corregao de continuidade, o resultado e significante, 
mas, com a correqao, e nao significante. Uma opqao razoavel - desde que a literatura confirme 
seus resultados - e aplicar o teste de x2 sem a correqao de continuidade. 

Exemplo 5.7 

Para o exemplo 5.6, voce tambem pode calcular o valor de x2 com correqao de continuidade. Aplicando a formula (5.2), vem: 

( 1455x 2 

(1215x 380-75 x785 | - 2^ j *1.455 

X = (215 + 75 ) x (785 + 380) x (215 + 785 1 x (75 + 380) 

(22097,5} z x 1455 710475781593,75 

---—-= --— = 4 622 

290 x 1.165 x 1.000 x 455 153721750000 

Como o valor calculado de y2 (4,622) e maior do que o valor critico com 1 grau de liberdade e no nivel de significancia de 5% 
(3,84), a conclusao e a de que, nesse nivel de significancia, dores no joelho estao associadas ao fato de correr mais de 25 
km/semana. 

Se voce estiver usando um programa para computador, vai obter o p-valor = 0,0316 (maior do que o obtido anteriormente, porque 
o teste com corregao de continuidade se torna mais conservador). 






5.2. TESTE DE PROPORgOES POPULACIONAIS 

Os estudos prospectivos e os ensaios clmicos sao feitos para comparar proporgoes 
populacionais ou probabilidades. 70 


Exemplo 5.8 

Para comparar tratamento nao operatorio com cirurgia conservadora nos casos de trauma esplenico, 136 pacientes foram 
randomizados para essas duas intervengoes. O desfecho era haver ou nao haver complicagoes. Dos 32 nao operados, 3 tiveram 
complicagoes e, dos 104 submetidos a cirurgia, 25 tiveram complicagoes. 71 Foram, entao, comparadas as proporgoes de pacientes 
com complicagoes nos dois grupos. 


Para proceder ao teste: 

Primeiro passo : Estabeleqa a hipotese da nulidade de que a probabilidade de unidades com 
determinada caracteristica e a mesma nos dois grupos. A hipotese alternativa e de que existe 
diferenqa entre grupos. Estabeleqa o nivel de significance. 

Segundo passo: Calcule as frequences marginais e o total geral, como mostra a Tabela 5.2. 


Tabela 5.2 - Valores literals em uma tabela 2x2 


Grupo 

Sim 

Caracteristica A 

Nao 

Total 

1 

a 


b 

a + b 

2 

c 


d 

c + d 

Total 

a + c 


b + d 

n 


Terceiro passo: Calcule a proporqao de unidades com a caracteristica A no Grupo 1: 

a 


Quarto passo: Calcule a proporqao de unidades com a caracteristica A no Grupo 2: 




c 

c+d 


Quinto passo: Calcule a proporqao de unidades com a caracteristica A nos dois grupos: 

a+c 

P= - 

n 


Sexto passo: Calcule a proporqao de unidades sem a caracteristica A nos dois grupos: 






Verifique que: 


b+d 

<7 =- 

n 


p+q=\ 


Setimo passo : Calcule a estatistica: 


Z = 


P2-Pl 


(1 n 

rr*J 


(5.4) 


Oitavo passo : Sob a hipotese da nulidade, a estatistica z tern distribuiqao aproximadamente 
normal padronizada, 72 desde que np > 5 e nq > 5. Compare 0 valor absoluto de z calculado com o 
valor critico de z (Tabela 1 do Apendice) no nivel estabelecido de significance. Se voce estiver 
usando um programa para computador para fazer esses calculos, vai obter o p-valor. 


Exemplo 5.9 

Reveja 0 Exemplo 5.8. Para fazer o teste: 

Primeiro passo: Hipotese da nulidade - a probabilidade de pacientes que tern complicagdes quando submetidos a tratamento nao 
operatorio e igual a probabilidade de pacientes que tem complicagdes quando submetidos a cirurgia conservadora. Seja a = 0,05. 

Segundo passo: Apresente os dados em uma tabela 2x2. Calcule as frequences marginais e o total geral. 


Participantes da pesquisa segundo o tipo de tratamento e a ocorrencia ou nao de complicates 


Tratamento 

Sim 

Complicates 

Nao 

Total 

Nao operatorio 

3 


29 

32 

Cirurgico 

25 


79 

104 

Total 

28 


108 

136 


Fonte: SCARPELIN1, S.; ANDRADE, J.I.; STRACIERE, L.D.S.; GRADE, MACCHETI, A.H.; PASSOS, ADC.Estudo comparative) entre 

o tratamento nao operatorio e a cirurgia conservadora no trauma esplenico. Rev Col Bras Cir 26(5): 281-284, 1999. 

Terceiro passo: Calcule as proporgoes, que estao dadas na tabela. 

Participantes da pesquisa segundo o tipo de tratamento e a ocorrencia ou nao de complicates (tabela auxiliar) 


Tratamento 

Complicates 

Total 

Propor^ao (sem complicates) 


Sim 

Nao 



Nao operatorio 

3 

29 

32 

0,093750 

Cirurgico 

25 

79 

104 

0,240385 

Total 

28 

108 

136 









Proporgao 


0,205882 


0,794118 


Quarto passo: Calcule a estatlstica de teste, dada pela formula (5.4): 


z = - = -1,794 

I 0,205882 x 0,794118 X + ^4) 


0,093750 - 0,240382 


Quinto passo: Como o valor absoluto de z calculado (-1,794) e, em valor absoluto, menor do que o valor crltico no m'vel de 5% 
de significance (1,96), nao se rejeita a hipotese de que, nos casos de trauma esplenico, a probabilidade de pacientes com 
complicaqoes e a mesma, quer se faqa tratamento nao operatorio, quer se faqa cirurgia conservadora. 

Se voce estiver usando um programa de computador para fazer esses calculos, vai obter p-valor = 0,072813. 

5.2.1. Corre^ao de continuidade 

Muitos estatfsticos recomendam calcular o valor de z com corregao de continuidade. A formula 
(3.4) fica, entao, como segue: 



(5.5) 


em que \p2 - pl\ indica 0 valor absoluto da diferenga. 

O valor de z com a correqao de continuidade e sempre menor do que 0 valor de z sem a 
correqao. Logo, a corregao de continuidade produz um teste mais conservador, isto e, um teste 
que tern menor probabilidade de rejeitar a hipotese da nulidade. Se a amostra for pequena, o 
efeito da corregao de continuidade sera ainda maior. 

IMPORT ANTE: 

No caso de uma tabela 2«2,a formula (5.2) e matematicamente igual ao quadrado da formula (5.4). 

As distributes estatisticas, neste caso, sao iguais. 73 
Entretanto, as hipoteses em teste sao diferentes. 74 






5.3. TESTE EXATO DE FISHER 


Indicagao: Voce usa o teste exato de Fisher quando quer testar a hipotese de que a probabilidade 
de ocorrer determinada categoria de uma variavel e a mesma em dois grupos. Alem disso, a 
amostra e pequena. 


Exemplo 5.10 

Em uma pesquisa se perguntou a um grupo de pessoas se gostariam de assistir a determinado jogo de futebol no estadio. O 
objetivo era testar a hipotese de nulidade de que e menos provavel um homem dizer “Nao”, do que uma mulher. Veja os dados na 
Tabela 5.3. 


Tabela 5.3 - Participantes de pesquisa segundo o sexo e a resposta 


Sexo 

Sim 

Resposta 

Nao 

Total 

Homens 

9 


1 

10 

Mulheres 

5 


4 

9 

Total 

14 


5 

19 


Os calculos necessarios para proceder ao teste exato de Fisher sao muito complicados. Isso 
nao seria obstaculo para os pesquisadores de hoje, que possuem computadores, mas e a razao de 
esse teste ser menos conhecido do que o teste de x2 de Pearson. 

De qualquer forma, o teste exato de Fisher apresenta outra dificuldade: nao usa uma funqao 
matematica que permita calcular um valor, que seria a estatistica de teste. E preciso calcular a 
probabilidade de obter os dados observados e, alem disso, as probabilidades de obter, sob a 
hipotese da nulidade, valores mais extremos do que os observados. Essas probabilidades sao 
obtidas por meio da formula: 


(a+b)!(c+d)!(a+c)!(fo+d)! 

n\a\b\c\d\ 


(5.3) 


Calcular essas probabilidades e trabalho demorado, por conta dos fatoriais 75 (indicados pelo 
simbolo “!”). No entanto, para tornar a questao mais concreta, vamos estudar o procedimento do 
teste por meio de exemplos. Reveja o Exemplo 5.10. Procure na tabela a celula com menor 
frequencia: e 1. Vamos calcular a probabilidade de ocorrer esse valor usando a formula (5.3). 


P(l) = 


(9+1)! (5+ 4)! (9+ 5)! (1+4)! 


0,1084 


19! 9! 1! 5! 4! 




O que seria mais “extremo” do que, entre 10 homens, apenas um dizer “Nao” querer ir ao 
estadio para assistir a uma partida de futebol? Seria, entre 10 homens, nenhum dizer “Nao”. 
Como a amostra ja foi tomada, as frequencias marginais precisam ser mantidas. No entanto, 
podemos calcular a probabilidade de nenhum homem, em 10, dizer “Nao”. Veja como ficaria a 
distribuiqao dos dados: 


Participantes de pesquisa segundo sexo e opiniao (Tabela auxiliar) 


Sexo 

Sim 

Opiniao 

Nao 

Total 

Homens 

10 


0 

10 

Mulheres 

4 


5 

9 

Total 

14 


5 

19 


A probabilidade de ocorrer 0 (zero), valor mais extremo, e: 


P(0) = 


(10 + 0)!(4 + 5)!(10 + 4)!(0 + 5)! 
19! 10! 0! 4! 5! 


0,0108 


Vamos sistematizar o procedimento para o teste exato de Fisher. 

Primeiro passo : Estabeleqa a hipotese da nulidade, de que a probabilidade de respostas negativas 
nao difere entre os sexos. A hipotese alternativa e a de que a probabilidade de respostas 
negativas e menor entre homens. Seja a = 5%. Note: o teste e unilateral. 

Segundo passo : Procure, na tabela que apresenta os dados, a celula com menor frequencia. 
Calcule a probabilidade de obter os valores observados nessa tabela usando a formula (5.3). 
Terceiro passo : Voce tern a celula com menor frequencia. Construa, agora, outras tabelas com 
as mesmas frequencias marginais, diminuindo sucessivamente o valor numerico da celula que 
apresenta a menor frequencia. No Exemplo 5.10, a menor frequencia e 1. Entao construa outra 
tabela com frequencia 0 no lugar da frequencia 1, mantendo fixos os valores dos totais marginais 
da tabela. Depois calcule a probabilidade de obter esse valor extremo. 

Entende-se valores extremos em termos de probabilidade. Valores extremos sao aqueles que 
poderiam ocorrer, mas tern probabilidade igual ou menor do que a dos valores observados. No 
exemplo, mais “extremo” do que, entre 10 homens, 1 “Nao” querer ir ao estadio seria, em 10 
homens, ninguem dizer “Nao”. Calculam-se as probabilidades de ocorrer tanto zero como um 
homem dizendo “Nao”, ou seja, P(0) e P(l). 

Quarto passo: Some as probabilidades calculadas. Para o Exemplo 5.10: 


0,1084 + 0,0108 = 0,1192 



0 1 23456789 10 

N e de homens dizendo “Nao'' 

Figura 5.5 Valores correspondentes ao p-valor. 


Quinto passo : O procedimento do teste consiste em rejeitar a hipotese da nulidade toda vez que a 
soma das probabilidades calculadas for igual ou menor do que o mvel de significancia 
estabelecido. A soma das probabilidades calculadas e o p-valor. No exemplo, nao se rejeita a 
hipotese de que a probabilidade de respostas negativas seja a mesma para os dois sexos, uma vez 
que o p-valor e 0,1192 > 0,05. 


Exemplo 5.11 

Imagine que se perguntou, a 12 participantes de pesquisa, se ja haviam sido vacinados contra gripe e se tiveram ou nao gripe no 
inverno seguinte. As respostas foram: de 7 vacinados 1 teve gripe e, de 5 nao vacinados, 4 tiveram gripe no ano anterior. O 
pesquisador quer saber se a probabilidade de ter gripe e menor no grupo vacinado. Nao pode optar pelo teste de x2 porque a 
amostra e muito pequena. Precisa fazer o teste exato de Fisher. 

Participantes da pesquisa classificados segundo as caracteristicas: ter sido vacinado contra gripe e ter tido gripe no inverno 

seguinte 


Ter sido vacinado 

Sim 

Ter tido gripe 

Nao 

Total 

Sim 

1 

6 

7 

Nao 

4 

1 

5 

Total 

5 

7 

12 


Primeiro passo: A hipotese da nulidade e a de que a probabilidade de ter gripe e a mesma nos dois grupos. A hipotese alternativa 
e a de que a probabilidade de ter gripe e menor no grupo vacinado. O nivel de significancia e a = 0,05. 

Segundo passo: Os dados estao em uma tabela 2x2; foram calculados os totais marginais e o total geral. A menor frequencia e 1. 
Vamos trabalhar com a primeira celula, “Sim”-“Sim”. A probabilidade de obter os valores observados usando a formula (5.3) e: 


P(l) = 


(l + 6)!(4 + l)!(l + 4)!(6 + l)! 
12! 1! 6! 4! 1! 


0,044192 


Terceiro passo: Vamos construir outra tabela, com resultado mais extremo do que o obtido e os mesmos totais marginais (em 
negrito nas duas tabelas). Como? De 7 vacinados, 1 teve gripe. Entao seria mais extremo, de sete vacinados, nenhum ter tido 
gripe. 


Participantes da pesquisa classificados segundo as caracteristicas:ter sido vacinado contra gripe e ter tido gripe no inverno 

seguinte Tabela auxiliar: valores mais extremos 


Ter sido vacinado 


Ter tido gripe 

Total 


Sim 

Nao 


Sim 

0 

7 

7 


Nao 


5 


0 


5 









Total 


5 


7 


12 


Calcule a probabilidade de obter os valores mais extremos, apresentados na tabela, usando a mesma formula (5.3): 


P(0) = 


(0 + 7)! [5 + 0)! CO+ 5)! (7 + 0)! 
12! 0! 7! 5! 0! 


0,00126 


Quarto passo: Some as probabilidades calculadas. 


0,04419 + 0,00126 = 0,04545 


♦—♦ 
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2 3 4 5 

N Q de vacinados com gripe 



Figura 5.6 Valores correspondentes ao p-valor. 


Quinto passo: Como o p-valor (soma das probabilidades calculadas) e 0,04545 < 0,05, existe evidencia de que a probabilidade de 
ter gripe e menor no grupo vacinado. 


O teste exato de Fisher, como feito aqui, e unilateral. Para fazer um teste bilateral, o p-valor 
nao pode ser, simplesmente, duplicado, porque a distribuiqao pode ser assimetrica. E preciso 
calcular as probabilidades associadas aos valores mais extremos dos dois lados. 


Exemplo 5.12 

Um pesquisador quer saber se a proporgao de pessoas que se queixam de dor e a mesma nos dois sexos. Para 15 pacientes de uma 
cllnica odontologica que estavam sendo submetidos ao mesmo tratamento, foram anotados o sexo e o fato de ter ou nao feito 
queixa de dor durante o tratamento. Como a amostra e muito pequena, deve ser aplicado o teste exato de Fisher. 76 

Pacientes classificados segundo o sexo e a queixa de dor 


Sexo 

Sim 

Queixa de dor 

Nao 

Total 

Mulher 

2 


3 

5 

Homem 

6 


4 

10 

Total 

8 


7 

15 


Primeiro passo: A hipotese da nulidade e a de que a proporqao de pessoas que se queixam de dor e a mesma nos dois sexos. A 
hipotese alternativa e a de que a proporqao de pessoas que se queixam de dor e diferente nesses dois grupos. Seja a = 5%. 

Segundo passo: Calcule a probabilidade de ocorrerem os valores observados usando a formula (5.3): 


P(2,S) 


(2 + 3)! (6+ 4)! (2+ 6)! (3+ 4)! 
15! 2! 3! 6! 4! 


0,326 


Terceiro passo: Calcule a probabilidade de ocorrerem valores mais extremos do que os observados usando a formula (5.3). Para 










isso, e preciso construir outras tabelas com os mesmos totais marginais, porem com resultados “mais extremos” do que os 
observados. 

A menor frequencia na tabela dada neste exemplo e 2, para “Mulher”-“Sim”. Vamos, entao, trabalhar essa primeira celula. 
Podemos construir outras duas tabelas com os mesmos totais marginais (em negrito, nas tabelas), com resultados 1 e zero, para 
“Mulher”-“Sim”e calcular respectivas probabilidades de ocorrencia. Veja a distribuigao dos dados, para uma mulher dizendo 
“Sim”: 


Pacientes classificados segundo o sexo e a queixa de dor (Tabela auxiliar) 


Sexo 


Mulher 

Homem 

Total 


Queixa de dor 


Sim 

1 

7 

8 


Nao 

4 

3 

7 


Total 

5 

10 

15 


A probabilidade de uma mulher dizer “Sim” e: 


P(1,S) 


(l + 4)!(7 + 3j!(l + 7)!(4 + 3)! 
15! 1! 4! 7! 3! 


0,093 


Veja a distribuigao dos dados para nenhuma (zero) mulher dizendo “sim”: 


Sexo 

Mulher 

Homem 

Total 


Pacientes classificados segundo o sexo e a queixa de dor (Tabela auxiliar) 

Queixa de dor 


Sim 

0 

8 

8 


Nao 

5 

2 

7 


A probabilidade de ocorrerem esses valores e: 


f0 + 5)!f8 + 21!(0 + 8)!(5 + 21! 

^ =- 15 ! 0! 5! 8! 2! -= °-°° 7 


Total 

5 

10 

15 


Entao, a probabilidade de ocorrerem valores iguais ou mais extremos (zero ou 1) do que 2 mulheres dizendo “Sim” (para um teste 
unilateral) e: 


P(2,S) + P(1,S)+ P(0,S) = 0, 326+ 0,093+0,007 = 0,426 
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Figura 5.7 - Valores correspondentes ao p-valor para teste unilateral. 












Como a hipotese alternativa e a de que a proporgao de pessoas que se queixam de dor e diferente nos dois sexos, o teste e 
bilateral. Calculamos a probabilidade de 2 ou menos mulheres terem se queixado de dor. Vamos agora para o outro lado, isto e, 
calcular as probabilidades de 3, 2,1 e 0 mulheres nao terem se queixado de dor. 

Veja: 3 mulheres nao terem se queixado de dor foi o valor observado. Essa probabilidade ja foi calculada: e 0,326. Vamos, entao, 
calcular as probabilidades de ocorrerem 2, 1 e 0 mulheres dizendo “Nao”. 


(3 + 2)!(5 + 5)!(3 + 5)!(2 + 5)! 

P(2 ' = --' 15! 3i~2 ! 5 i 5 !~-” = °' 392 

(4 + l)!(4 + 6)!(4 + 4)!(l + 6)! 

= --= °' 163 

(5 + 0)! (3+ 7)! (5+ 3)! (0 + 7)! 

pm AH = --—-—-—- - = 0,019 

^ ’ 15! 5! 0! 3! 7! 


Olhe as probabilidades calculadas e constate: a probabilidade de duas mulheres dizendo “Nao” e maior do que a probabilidade de 
ocorrencia dos valores observados. Entao, esse nao e um valor extremo. 

Quarto passo: Some as probabilidades calculadas, de ocorrerem valores iguais ou mais extremos que os observados, dos dois 
lados: 


P(2,S) + P(1,S)+ P(0,S) + P(1,N)+ P(0,N)= 

0, 326 + 0,0093 + 0,007+ 0,163 + 0,019 = 0,608 
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Figura 5.8 - Valores correspondentes ao p-valor para teste bilateral. 

Quinto passo: A probabilidade calculada e o p-valor. Entao, voce nao rejeita a hipotese de que a proporqao de pessoas que se 
queixam de dor e a mesma nos dois sexos. 









5.4. TESTE DE MCNEMAR 


O teste de McNemar testa a consistencia das respostas de dois grupos, desde que as respostas 
dos participantes sejam binarias, isto e, do tipo “sim” ou “nao”. Portanto, o teste de McNemar 
nao testa a independence de duas variaveis. Por exemplo, para estudar o efeito de uma 
intervenqao, o pesquisador precisa de duas amostras de pessoas: as que respondem “sim” e as 
que respondem “nao”. Faz a intervenqao e estuda a consistencia das respostas nos dois grupos, 
ou seja, se nos dois grupos as mudanqas ocorreram na mesma proporqao. Veja a Figura 5.9. 


Populagao “SIM” 


Amostra 







Populagao “NAO” 


Amostra 







Figura 5.9 - Consistencia de respostas. 


Para fazer o teste: 

Primeiro passo: A hipotese da nulidade e a de que o numero de pessoas que mantem a resposta 
inicial e a mesma nos dois grupos. A hipotese alternativa e a de que esses numeros sao 
diferentes. Estabelega o nivel de significancia. 

Segundo passo: Organize as respostas em uma tabela 2 x 2, de tal maneira que as pessoas que 
mudaram a resposta (diziam “Sim” e passaram a dizer “Nao” ou diziam “Nao” e passaram a 
“Sim”) sejam indicados por a e d. Calcule a estatistica de teste: 


(a-df 


a +d 


(5.6) 




















que tem distribuigao de x2 com 1 grau de liberdade. 

Terceiro passo: Compare o valor calculado de x2 que esta associado a 1 grau de liberdade com o 
valor crrtico de x2 no nrvel estabelecido de significancia (Tabela 2 do Apendice). Rejeite a 
hipotese da nulidade toda vez que o valor calculado de x2 for maior do que o valor crrtico. Se 
voce estiver usando um programa de computador para fazer esses calculos, vai encontrar o p- 
valor. 


Exemplo 5.13 

Imagine um ensaio para estudar efeitos adversos de um farmaco indicado para casos de hipertensao. Os 104 pacientes, com o 
mesmo perfil social e demografico, recem-diagnosticados e sem tratamento, responderam a diversas questoes, tanto no inicio do 
tratamento como 12 semanas apos. No inicio, 32 pacientes queixavam-se de cefaleia e 72 nao tinham essa queixa. 

No final do tratamento, 19 dos 32 que se queixavam antes nao tinham mais a queixa e, dos 72 que nao tinham queixa de cefaleia, 
1 passou a se queixar. 

Para fazer o teste de x2 de McNemar: 

Primeiro passo: A hipotese da nulidade e a de que o tratamento nao tem efeito sobre as queixas de cefaleia. Sob essa hipotese, 
espera-se que a probabilidade de que um paciente mude de situaqao seja a mesma nos dois grupos. Seja a = 0,05. 

Segundo passo: Organize a tabela 2 x 2 de tal maneira que as pessoas que mudaram a resposta sejam indicadas por a e d. Veja 
que: 

20 pacientes mudaram de resposta: 19 queixavam-se de cefaleia “antes” do tratamento e nao se queixavam “depois”. Entao, a = 
19. Um paciente nao se queixava “antes”, mas passou a se queixar “depois”. Entao, d = 1. 


Pacientes com queixas de cefaleia antes e depois de tratados 


Antes do tratamento 


Depois do tratamento 


Sem queixa 

Com queixa 

Sem queixa 

19 

13 

Com queixa 

71 

1 


Fonte: Dados ficticios com base em LUNA, R.L. Eficacia e tolerabilidade da associagao bisoprolol/ hidroclorotiazida na hipertensao arterial. Arq 
Bras Cardiol 71(4): 601-608, 1998. 


Segundo passo: Calcule o x2 de McNemar: 


2 _ (19-1) 18 


X = 


= — =16,20 
19 +1 20 


Terceiro passo: Como o valor calculado de x2 (16,20) com 1 grau de liberdade e maior do que o valor crrtico no nrvel de 5% de 
significancia (3,84), o resultado e significante. As queixas de cefaleia diminuiram com o tratamento. 

Se voce estiver usando um programa de computador para fazer esses calculos, vai encontrar p-valor = 0,000144. Como o p-valor 
e menor do que 0,05 (p < 0,05), a conclusao e a de que as queixas de cefaleia diminuiram com o tratamento 


5.4.1.Corre^ao de continuidade 

Muitos estatfsticos recomendam calcular o x2 de McNemar com corregao de continuidade, 





principalmente quando a amostra e pequena. Os programas de computador em geral apresentam 
essa correqao. A formula (5.6) fica, entao, como segue: 


_ (\a-d\-lf 

1 a+d 


(5.7) 


A estatfstica de teste com correqao de continuidade e menor do que o valor calculado sem a 
correqao. Entao, a correqao de continuidade produz um teste mais conservador, que tern menor 
probabilidade de rejeitar a hipotese da nulidade. Se a amostra for pequena, o efeito da correqao 
de continuidade sera ainda maior. 


Exemplo 5.14 

Reveja o exemplo 5.12. Como os programas de computador em geral fazem a corregao de continuidade, verifique: 


(|l9~l| —l) 2 _ 17 
19 + 1 20 


O valor calculado de y2 (14,45) e maior do que o valor critico com 1 grau de liberdade e no nrvel de 5% de significancia (3,84). 
Entao o resultado e significante no nivel de 5%. 

Se voce usar um programa para computador, encontrara p-valor = 0,0001. 

Observa^ao 

Se as frequencias observadas forem menores do que 5, nao calcule o valor do /2 de McNemar; 
faqa outro teste. 77 




RESUMO E OBJETIVO DO CAPITULO 


A tabelas de contingencia 2x2 sao muito frequentes nas publicaqoes 
de ler este Capitulo, voce sera capaz de, diante uma tabela 2x2, saber 
um dos testes: 

1. teste de y2 de Pearson; 

2. teste de proporqoes; 

3. teste exato de Fisher; 

4. teste de /2 de McNemar. 

Sabera, ainda, que a correqao de continuidade produz um teste mais conservador, mas e indicada 
se a amostra for pequena. 


da area da saude. Depois 
escolher, aplicar e indicar 


66 E usual apresentar o teste de qui-quadrado em textos que tratam de testes nao parametricos. No entanto, muitos estatisticos 
consideram que, pelo fato de comparar proporgoes, o teste de qui-quadrado nao seria parametrico. Veja Daniel, W.W. Applied 
nonparametric statistics. 2 nd ed. Pacific Grove: Duxbury, 1990. p. 178. 

67 Em ingles, a letra x e escrita “chi” e se le “cai”. Em portugues, escreva qui. 

68 As restrigoes foram estabelecidas por COCHRAN, W.O. Some methods for strengthening the common x 2 tests. Biometrics 10: 
417-451, 1954. 

69 Existe quern argumente contra a corregao de continuidade. Veja: GRIZZLE, J.E. Continuity correction in the x2 test for 2 x 2 
tables. The American Statistician 21: 28-32, 1967. 

70 O teste de x 2 leva ao mesmo resultado. Veja Teste de x2 em soniavieira.blogspot.com.br. 

72 Fonte: SCARPELIN1, S.; ANDRADE, J.I., STRACIERE, L.D.S.; GRADE, M.H.C.; MACCHETI, A.H., PASSOS, A.D.C. 
Estudo comparativo entre o tratamento nao operatorio e a cirurgia conservadora no trauma esplenico. Rev Col Bras Cir 26(5): 
281-284, 1999. 

72 No Exemplo 5.9, a distribuigao e apenas aproximadamente normal, porque np < 5, mas a amostra e grande. 

73 Os valores de x 2 com um grau de liberdade sao iguais aos valores do quadrado de z (da distribuigao normal reduzida). 

74 Veja, por exemplo, FLEISS, J.L. Statistical methods for rates and proportions. 2nd ed. Nova York: Wiley, 1981. p. 22-24. 

75 O teste se baseia na distribuigao hipergeometrica. 

76 Os dados sao de 

PREACHER, KJ. Disponivel em: Interactive Fisher's Exact Test - Quantpsy.org. quantpsy.org/fisher/fisher.htm. Acesso em 4 de 
novembro de 2017. 

77 SIEGEL, S. Nonparametrics Statistics for the behavioral sciences. 2 nd ed. Nova York: McGraw-Hill, 1956. Note que o exemplo 
nao seguiu esta recomendagao. 




a.a.i i^aicuie os vaiores ae xz com e sem a corregao ae conunuiaaae para os aaaos apresentaaos no txempro a.r. vermque que a 
corregao de continuidade faz diminuir o valor da estatistica. 

5.5.2 Das 300 pessoas que chegavam de um voo a um grande aeroporto, 78 81 admitiram ter medo de voar e, das 200 pessoas que 

embarcavam em outro voo, mas no mesmo dia e na mesma hora, 32 admitiram tambem ter medo. Calcule as proporgoes 
(medo na chegada e medo na partida) e faga um teste de /2. 

5.5.3 Os dados apresentados na Tabela 5.4 foram obtidos por meio de estudo transversal com 1.330 nipo-brasileiros de primeira e 

segunda geragoes, de ambos os sexos, com mais de 30 anos. Com base no indice de massa corporal, os nipo-brasileiros de 
primeira e segunda geragoes foram classificados como tendo ou nao sobrepeso e obesidade. Faga o teste de x2 e de a 
interpretagao tendo em vista a amostra estudada. 


Tabela 5.4 - Nipo-brasileiros com sobrepeso segundo a geragao (Bauru SP, 2000) 


Geragao 

Sim 

Sobrepeso 

Nao 

Primeira 

82 


175 

Segunda 

525 


548 


Fonte: SIMONY, R.F. et al. Prevalencia de sobrepeso e obesidade em nipo-brasileiros: comparagao entre sexos e geragao. Rev Nutr 21(2): 169-176, 
2008. 

5.5.4. Foi feito um ensaio clinico para estudar o efeito da betametasona sobre a dor no pos-operatorio de pacientes submetidos a 
tratamento endodontico. O experimento era duplo-cego, randomizado e foram administrados dois comprimidos de 
betametasona para o grupo experimental e dois comprimidos de placebo para o grupo controle antes da instrumentagao. 
Os dados estao na Tabela 5.5. Faga o teste. 

Tabela 5.5 - Participantes da pesquisa segundo o grupo e o relato de dor 

Grupo Relato de dor 

Sint Nao 

Controle 9 12 

Experimental 15 2 

Fonte: QU1NTANA-GOMES, J.R.V.; ANDRADE, E.K. Estudo clinico dos efeitos da betametasona sobre a incidencia da dor apos a 
instrumentagao endodontica. J Bras Odont Clinica 2(12): 73-76. [s.d.] 


5.5.5. Acredita-se que certo tratamento prolongue a vida de pessoas que sofreram um ataque cardiaco. 79 Foi feito um ensaio 

clinico em que cinco pacientes receberam o novo tratamento (grupo tratado) e cinco receberam o tratamento convencional 
(grupo controle). Os 10 pacientes foram cuidadosamente selecionados: mesma faixa de idade, mesma gravidade do 
ataque, mesmo estado geral de saude, sendo designados aos grupos por processo aleatorio. Cinco anos depois, estavam 
vivos 4 pacientes do grupo tratado e 2 do grupo controle. Existe evidencia de que o tratamento ajudou? 

5.5.6. Para verificar se doenga periodontal (gengivite) esta associada ao habito de fumar, realizou-se um estudo envolvendo 

policiais militares. Os participantes da pesquisa foram classificados em dois grupos: casos (com doenga periodontal) e 
controles (sem doenga periodontal). Todos estavam na mesma faixa de idade, com o mesmo estado civil, na mesma 
patente militar e no mesmo nfvel socioeconomico. Perguntou-se aos policiais militares se eles fumavam ou nao. Os dados 
estao na Tabela 5.6. Faga o teste. 


Tabela 5.6 - Habito de fumar e gengivite 


Grupo 


Habito de fumar 



Sim 

Nao 

Casos 

26 

15 

Controles 

25 

29 


Fonte: CRUZ, C.M.N. Estresse e fumo como fatores de risco para a doenga periodontal. Tese de mestrado. Campinas: Unicastelo, 2000. 


5.5.7. Imagine um ensaio clinico com 1.455 participantes: 1.165 tinham dor nos joelhos e 290 nao tinham dor nos joelhos. Eles 
receberam um tratamento em teste. Depois de tratados, 215 dos que nao tinham dor nos joelhos continuaram nao tendo e 
380 dos que tinham dor nos joelhos continuaram a ter. Importante: note que os numeros sao exatamente iguais aos da 
tabela do Exemplo 5.6, onde fizemos o teste de qui-quadrado de Pearson. Aqui, faga o teste de qui-quadrado de McNemar 
e explique o porque. 

Tabela 5.7 - Participantes da pesquisa segundo a dor antes e depois de tratados 


Tinham dor antes Tinham dor depois Total 



Nao 

Sim 


Nao 

215 

75 

290 

Sim 

785 

380 

1165 

Total 

1000 

455 

1455 


Fonte: http://www.theanalysisfactor.com/difference-between-chi-square-test-and-mcnemar-test/ 


5.5.8. Para verificar 80 se o disturbio da articulagao temporomandibular (DTM) em criangas e adolescentes esta associado ao sexo, 

foram examinados 604 estudantes com idades entre 8 e 17 anos, moradores de Piracicaba, SP. Foi constatada a disfungao 
em 118 dos 264 estudantes do sexo masculino e em 117 estudantes do sexo feminino. Calcule o valor de qui-quadrado e 
interprete. 

5.5.9. No ensaio controlado e randomizado denominado Women’s Health Initiative (Iniciativa para a Saude das Mulheres), 81 

16.608 mulheres em menopausa com idades entre 50 e 79 anos foram recrutadas em clinicas dos Estados Unidos entre 
1993 e 1998 para receberem hormonio (estrogeno e progesterona) ou placebo, com a finalidade de levantar os riscos e os 
beneficios associados ao uso dessa combinagao de hormonios. No ensaio, 8.506 mulheres receberam o hormonio e 8.102 
receberam placebo. Na avaliagao das caracteristicas dessas mulheres apos a randomizagao, verificou-se que, no grupo 
tratado, 1.623 usavam aspirina e, no grupo controle, 1.631. Teste a hipotese de que a proporgao de usuarias de aspirina e a 
mesma nos dois grupos. 


5.5.10. Os traumas facials ocorrem, predominantemente, em adultos jovens, mas houve um aumento de incidencia entre idosos. 
Os dados 82 apresentados na Tabela 5.8 buscam verificar se existe associagao entre sexo e etiologia da fratura (queda e 
outras causas, dentre as quais estao agressao e acidentes de transito). Faga o teste. 


Tabela 5.8 - Distribuigao dos participantes da pesquisa segundo o sexo e a etiologia da fratura na face 


Sexo 



Queda 

Homens 

11 

Mulheres 

12 

Total 

23 


Etiologia 


Outras causas 

15 

5 


Total 


26 

17 


20 


43 



78 FREUND, J.E.; SMITH, R.M. Statistics: a first course. 4 th ed. Englewood Cliffs: Prentice Hall, 1970. p. 411. 

79 HODGES, J.L., LEHMAN, E.L. Basic Concepts of Probability and Statistics. 2 nd ed. San Francisco: Holden Day, 1970. 

80 COSTA, L.F.; GUIMARAES, J.P.; CHAOBAH, A. Prevalencia de disturbios da articulagao temporomandibular em criangas e 
adolescentes brasileiros e sua relagao com ma oclusao e habitos parafuncionais: um estudo epidemiologico transversal. J Bras 
Ortodon Ortop Facial 9(49): 67-74, 2004. 

81 Women’s Health Initiative Randomized Controlled Trial. Risks and benefits of estrogen plus progestin in healthy post 
menopausal women. JAMA 288 (3): 321-333, 2002. 

82 Chrcanovic, B.R.; Souza, L.N.; Freire-Maia, B. Fraturas de face em idosos: estudo retrospectivo de um ano em hospital publico 
de Belo Horizonte, MG. Rev ABO Nac 16(1): 39-44, 2008. 


• • • 



Tabelas 2 x s 



Neste Capitulo sao examinadas algumas estatisticas que estudam a relaqao entre duas variaveis 
categorizadas, apresentadas em tabelas de contingencia 2 x s, em que s indica o numero de 
colunas. 


Exemplo 6.1 

Imagine que, para verificar se sexo e estado antropometrico estao associados, pesquisadores classificaram 1.000 universitarios 
segundo essas duas variaveis e apresentaram os dados em uma tabela. 

Participantes da pesquisa segundo o sexo e o estado antropometrico 


Sexo 


Estado antropometrico 



Magreza 

Eutrofia 

Sobrepeso 

Masculino 

200 (20%) 

150 (15%) 

50 (5%) 

Feminino 

250 (25%) 

300 (30%) 

50 (5%) 


Voce tern, neste exemplo, uma tabela 2 | 3 para estudar a relagao entre sexo e estado antropometrico. 




6.1. TESTE DE /2 DE PEARSON 

Indicagao: O teste de y2 de Pearson e indicado para testar a hipotese de que duas variaveis 
qualitativas sao independentes. Veja o procedimento. 

Primeiro passo: Estabeleqa as hipoteses e o nivel de significancia. 

• H 0 : as duas variaveis sao independentes. 

• Hp as duas variaveis nao sao independentes. 

Nivel de significancia: normalmente sao estabelecidos nrveis de significancia de 0,01 ou 0,05 
ou 0,10. 

Segundo passo : Calcule as frequences esperadas sob H 0 . Para obter a frequencia esperada de 
determinada celula: 

1. Multiplique o total marginal de cada coluna pelo total marginal da respectiva linha. 

2. Divida o resultado pelo tamanho da amostra. 

3. Verifique: os totais das frequences esperadas sao, obrigatoriamente, iguais aos das 
frequences observadas. 

Terceiro passo: Calcule a estatrstica de teste. 




(O-Ef 

E 


( 6 . 1 ) 


Na formula, O indica frequences observadas e E indica frequences esperadas. 

Quarto passo: O valor calculado de y2 esta associado a (2 - 1) (s - 1) graus de liberdade. 
Compare o valor calculado de x2 com o valor crrtico (Tabela 2 do Apendice) no nrvel de 
significancia estabelecido. Toda vez que o valor calculado da estatrstica for igual ou maior do 
que o valor crrtico, rejeite a hipotese da nulidade. Se voce estiver usando um programa para 
computador, obtera o p-valor. 

Exemplo 6.2 

Reveja o exemplo 6.1: os dados sao as frequencias observadas pelos pesquisadores. Calcule os totais marginals e o total geral. 

Participantes da pesquisa segundo o sexo e o estado antropometrico 


Sexo Estado antropometrico Total 



Magreza 

Eutrofia 

Sobrepeso 


Masculino 

200 

150 

50 

400 

Feminino 

250 

300 

50 

600 

Total 

450 

450 

100 

1.000 



Para fazer o teste de x2 : 

Primeiro passo: A hipotese da nulidade estabelece que o estado antropometrico nao depende do sexo; a hipotese alternativa 
estabelece que sexo e estado antropometrico sao dependentes. Nivel de significancia: 5%. 

Segundo passo: Calcule as frequencias esperadas sob H 0 . Assim, para obter a frequencia esperada de magros de sexo masculino: 

1. Multiplique o total de magros (450) pelo total de pessoas do sexo masculino (400). 

2. Divida o resultado pelo tamanho da amostra (1.000). 

Para achar as demais frequencias esperadas, proceda de maneira analoga. Veja os calculos na tabela. 


Calculo das frequencias esperadas 


Sexo 

Magreza 

Estado antropometrico 

Eutrofia 

Sobrepeso 

Total 

Masculino 

450 x 400 /1.000 

450 x 400 / 1.000 

100 x 400 /1.000 

400 

Feminino 

450 x 400 /1.000 

450 x 600 / 1.000 

100 x 600 /1.000 

600 

Total 

450 

450 

100 

1.000 


Fazendo os calculos, voce obtem as frequencias esperadas: 

Frequencias esperadas de participantes da pesquisa segundo o sexo e o estado antropometrico 


Sexo Estado antropometrico Total 



Magreza 

Eutrofia 


Sobrepeso 



Masculino 

180 

180 


40 


400 

Feminino 

270 

270 


60 


600 

Total 

450 

450 


100 


1.000 

Terceiro passo: Calcule a estatistica de teste dada pela formula (6.1). Para fazer 

os calculos: 



1. Calcule as diferengas entre os valores observados e os valores esperados. 





2. Eleve as diferengas ao quadrado. 






3. Divida os quadrados das diferengas pelos respectivos valores esperados. 





4. Some. 







Para obter o valor de j2, sao necessarios diversos calculos. 







Calculos auxiliares para obtengao 

do X 2 




Sexo 

Estado antropometrico 

O 

E 

O-E (O-E) 2 

(l O-Ef/E 

Masculino 

Magreza 

200 

180 

20 

400 

2,222 


Eutrofia 

150 

180 

-30 

900 

5,000 


Sobrepeso 

50 

40 

10 

100 

2,500 

Feminino 

Magreza 

250 

270 

-20 

400 

1,481 


Eutrofia 

300 

270 

30 

900 

3,333 


Sobrepeso 

50 

60 

-10 

100 

1,667 


1.000 1.000 0 16,204 


Soma 


Quarto passo: O valor calculado de x2 e 16,204, com (2 - 1) (3 - 1) = 2 graus de liberdade. No nlvel de 5% de significancia e 
com 2 graus de liberdade, o valor crltico de x2 (Tabela 2 do Apendice) e 5,99. Como o valor calculado de x2 e maior do que o 
valor crltico, rejeite a hipotese de independencia. O estado antropometrico depende do sexo. Se voce estiver usando um programa 
para computador, obtera p-valor = 0,000304. 


6.1.1. Exigencias teoricas para aplicagao do teste de y2 

Preste atengao as exigencias: 

1. Independencia: as caracteristicas em comparagao devem ser independentes, como, por 
exemplo, um grupo ser constituido por homens e o outro, por mulheres. 

2. Frequences esperadas: se s > 2, menos de 20% das frequences esperadas podem ser 
menores do que 5. Nenhuma frequencia esperada pode ser inferior a 1. Se isso acontecer, 
junte categorias. 


IMPORT ANTE: 

A tabela 2x2 vista no Capitulo 5 e um caso particular da tabela de contingencia 2 x s vista aqui. Entao, a formula para o calculo 
de x2 apresentada neste Capitulo pode ser usada para tabelas 2 x 2. Os resultados serao iguais porque as formulas sao iguais, 
como se pode demonstrar por simples algebra. Aquela e mais facil de aplicar e revelou a vantagem adicional de usar a mesma 
notaqao usada posteriormente, em outros testes apresentados naquele Capitulo. 


6.1.2. Algumas questoes teoricas 

Voce pode deixar de ler esta segao sem prejuizo na leitura do restante do livro, mas talvez tenha 
interesse em obter mais algumas informagoes sobre o teste de x2 . 

6.1.3. Graus de liberdade 

O que significa grau de liberdade? E o numero de observagoes que podem variar livremente - ou 
seja, e o numero de observagoes “livres para variar”. Nas tabelas de contingencia, o total das 
linhas e o total das colunas sao “fixos” - quando a amostra ja foi coletada. 

Para tornar a explicagao mais concreta, veja a tabela 2x2 dada em seguida: os totais das 
linhas e das colunas sao “fixos” porque, terminada a coleta de dados, voce sabe que foram 
entrevistados 200 homens e 200 mulheres. Houve 300 respostas “Sim” e 100 respostas “Nao”. 

Antes de tabular os dados, alguem poderia imaginar, por exemplo, que 150 mulheres disseram 
“Sim”. Se isso fosse verdade, automaticamente, os demais valores estariam determinados. So ha 
liberdade para “fazer variar” um valor. Entao, o grau de liberdade e 1. 

Sexo Opiniao Total 

Sim Nao 


Mulheres 


150 


200 





Homens 


200 


Total 300 100 400 

Veja agora a tabela 2 x s. As celulas em branco (poderiam ser quaisquer outras) estao livres 
para variar. As celulas com pontos ficam, entao, determinadas porque os totals sao “fixos”. Os 
graus de liberdade sao, portanto, (2 - 1) (s - 1). 


Grupos 


Grau da doen^a 




Leve 

Moderado 

Severo 

Total 

A 



• 

100 

B 

• 

• 

• 

100 

Total 

200 

150 

50 

400 


6.1.4. Frequences esperadas 

Volte ao Exemplo 6.1: Os dados sao as frequences observadas pelos pesquisadores. Para aplicar 
o teste de /2: 

Primeiro passo: Estabeleqa a hipotese da nulidade, de que o estado antropometrico nao depende 
do sexo. Estabeleqa a hipotese alternativa, de que o estado antropometrico esta associado ao 
sexo. Estabeleqa o nlvel de significance. 

Segundo passo: Considere verdadeira a hipotese da nulidade de que o estado antropometrico nao 
depende do sexo. Sob essa hipotese: 

• A proporgao de magros deve ser igual nos dois sexos. 

• A proporgao de eutroficos deve ser igual nos dois sexos. 

• A proporgao de adolescentes com sobrepeso e obesos deve ser igual nos dois sexos. 

Calcule as proporgoes esperadas sob a hipotese da nulidade. Se sao 450 magros em uma 

amostra de 1.000 participantes, sob H 0 a proporgao esperada de magros e 

total de magros 450 „ ,, 

p = ---=-= 0,45 

tamanho da amostra 1.000 

Sao 450 eutroficos em uma amostra de 1.000 participantes. Logo, sob H 0 a proporgao 
esperada de eutroficos e 


_ total de eutroficos _ 450 _ 
tamanho da amostra 1.000 


Sao 100 participantes com sobrepeso em uma amostra de 1.000 participantes. Logo, sob H 0 , a 
proporgao esperada de sobrepesados e: 






total de sobrepesados 100 

p =-—-= --= 0,10 

tamanho da amostra 1.000 

Foram observados mais participantes de sexo feminino (600) do que do sexo masculino (400). 
Para obter a frequencia esperada de cada estado antropometrico em cada sexo, multiplique a 
proporqao que se espera de cada estado antropometrico sob H 0 pelo total de participantes desse 
sexo. Veja os resultados na tabela. 


Calculo das frequencias esperadas 


Sexo 


Estado antropometrico 


Total 


Magreza 

Eutrofia 

Sobrepeso 


Masculino 

0,45 x 400 

0,45 x 400 

0,10 x 400 

400 

Feminino 

0,45 x 600 

0,45 x 600 

0,10 x 600 

600 

Total 

450 

450 

100 

1.000 

Frequencias esperadas de participantes da pesquisa segundo o sexo e o 

estado antropometrico 


Sexo 


Estado antropometrico 


Total 


Magreza 

Eutrofia 

Sobrepeso 


Masculino 

180 

180 

40 

400 

Feminino 

270 

270 

60 

600 

Total 

450 

450 

100 

1.000 




6.2. PARTigAO DAS TABELAS 2 x S 

O teste de y2 tern interpretagao obvia quando e aplicado a uma tabela 2 x 2. No entanto, se uma 
das variaveis tiver mais de duas categorias, isto e, se os dados estiverem apresentados em uma 
tabela de contingencia 2 x s, a interpretagao nao e direta. 

Isso porque, se voce rejeitar a hipotese de independence, fica sem saber se a associagao 
ocorre entre todas as categorias de uma variavel ou apenas entre certas categorias dessa 
variavel. 

E posslvel fazer uma partigao da tabela original. Em outras palavras, e possrvel quebrar uma 
tabela grande em outras menores - e analisar essas tabelas menores separadamente. Recomenda- 
se, porem, que o numero de partigoes seja igual ou menor do que o numero de graus de liberdade 
do teste inicial. 

Mesmo assim, faga essa partigao somente se 

1) Tiver alguma hipotese formulada com base na literatura ou 

2) A analise inicial tiver fornecido evidencia contra a hipotese de independence (voce sera 
mais convincente se tiver usado nrvel de significance de 1%). 


Exemplo 6.3 

Reveja o Exemplo 6.1: para verificar se sexo e estado antropometrico estao associados, pesquisadores classificaram 1.000 
universitarios segundo essas duas variaveis. O p-valor do teste de x2 aplicado aos dados e 0,000304. Pode, portanto, ser feita a 
partigao da tabela. 

Vamos, primeiramente, aplicar o teste de x2 para verificar se o sexo esta associado ao peso adequado. Para fazer isso, vamos 
somar participantes com peso inadequado (magreza e sobrepeso) de cada sexo para comparar com os de peso adequado. 

Participantes da pesquisa segundo o sexo e o peso (adequado ou nao)(proporgoes entre parenteses) 


Sexo Peso adequado Total 



Sim 

Nao 


Masculino 

150 (15%) 

250 (25%) 

400 

Feminino 

300 (30%) 

300 (30%) 

600 

Total 

450 

550 

1.000 


O resultado do teste de x2 aplicado a essa tabela e 15,152 e o p-valor e 0,0001. A conclusao e de que o sexo esta associado ao 
estado antropometrico: pesos inadequados sao mais comuns no sexo masculino. Vamos estudar agora a associagao entre sexo e 
magreza e sobrepeso. 

Participantes da pesquisa com peso inadequado classificado, segundo o sexo e o estado antropometrico (proporgoes entre 

parenteses) 

Sexo Estado antropometrico Total 


Magreza 


Sobrepeso 


Masculino 

200 (36,36%) 

50 (9,09%) 

250 

Feminino 

250 (45,45%) 

50 (9,09%) 

300 

Total 

450 

too 

550 


O resultado do teste de x2 aplicado a essa tabela e 1,019 e o p-valor e 0,3129. Nao se rejeita a 
hipotese de independencia. Magreza e sobrepeso aparecem igualmente nos dois sexos. 

E dificil interpretar a associagao em tabelas de contingencia quando uma das variaveis tern 
mais de duas categorias. Por essa razao, vamos ver outro exemplo. 


Exemplo 6.4 

Para comparar uma nova droga (grupo tratado) com uma droga conhecida (controle positivo) na solugao da calvicie, um 
pesquisador acha importante ter um grupo usando placebo (controle negativo). Foram, entao, colocadas duas questoes: primeira, 
“droga tern efeito?” e segunda, “a nova droga tern efeito diferente do efeito da droga conhecida?”. O efeito da droga (positivo ou 
nenhum) sobre a calvicie foi avaliado pelos proprios participantes da pesquisa. 

Participantes da pesquisa segundo o grupo e o fato de terem sentido efeito positivo ou nao 


Grupo 


Efeito positivo 

Total 


Sim 

Nao 


Tratado 

64 

36 

100 

Controle positivo 

60 

40 

100 

Controle negativo 

26 

74 

100 

Total 

150 

150 

300 


Foi aplicado o teste de x2 de Pearson. O valor calculado de x2 com (2 - 1) (3 - 1) = 2 graus de liberdade e 34,88, significante no 
nivel de 1%. A conclusao e de que existe diferenga entre grupos. Qual grupo teve melhor resultado? Para responder a essa 
questao, vamos fazer a partigao da tabela. 

Para isso, somamos os dados dos participantes que receberam a nova droga com os dados dos participantes que receberam a 
droga conhecida para constituir um novo grupo - o grupo tratado. Esse novo grupo e comparado com o controle negativo 
(placebo) por meio de um teste de x2. 

Participantes da pesquisa segundo o grupo e o fato de terem sentido efeito positivo 


Grupo 

Efeito positivo 


Proporgao 


Sim 

Nao 

Total 

Sim 

Tratado 

124 

76 

200 

0,620 

Controle negativo 

26 

74 

100 

0,260 

Total 

150 

150 

300 

0,500 


O valor calculado de x2 com 1 grau de liberdade e 34,56, significante no nivel de 1% (Tabela 2 do Apendice). A proporgao de 
participantes da pesquisa que registrou efeito positivo foi maior no grupo tratado. No entanto, qual e a melhor droga, a nova ou a 
convencional? Compare o grupo tratado (nova droga) com o grupo controle positivo (droga convencional) por meio de um teste 
de X 2 . 





Participantes da pesquisa segundo o grupo e o fato de terem sentido efeito positivo 


Grupo 


Efeito positivo 


Propor^ao 


Sim 

Nao 

Total 

Sim 

Tratado 

64 

36 

100 

0,640 

Controle positivo 

60 

40 

100 

0,600 

Total 

124 

76 

200 

0,620 


O valor calculado de x2 com 1 gran de liberdade e 0,34, nao significante no ni'vel de 5%. Entao, nao foi detectada diferenga 
significante entre as drogas. 83 




6.3. PROCEDIMENTO DE MARASCUILO 


Indicagao: O procedimento de Marascuilo faz comparagdes multiplas, isto e, compara 
proporgoes populacionais, duas a duas. 

Se voce aplicou o teste de x2 a uma tabela de contingencia 2 x s e obteve resultado 
significante, pode fazer a partigao da tabela. Isso nem sempre resolve seu problema, porque o 
numero de partigoes deve ser igual ou menor ao numero de graus de liberdade do teste. Na 
verdade, voce quer um teste de comparagoes multiplas, mas nao existe uma tecnica estatlstica 
exata para comparagdes de proporgoes duas a duas. Voce pode, porem, optar pelo procedimento 
de Marascuilo, 84 que nao e tao conhecido, mas faz comparagdes multiplas. 


Exemplo 6.5 

Foi feito um estudo multicentrico para testar o efeito de um anti-hipertensivo sobre derrame recorrente. O protocolo permitia que 
os diferentes centros medicos envolvidos na pesquisa administrassem, como coadjuvante, o tratamento que sempre haviam 
indicado. Um pesquisador suspeitou de que esses tratamentos coadjuvantes poderiam ter efeito sobre a ocorrencia de novo 
derrame. Para testar essa hipotese, o pesquisador resolveu analisar novamente os dados apresentados na tabela a seguir. Aplicou o 
teste de jl. 

Participantes da pesquisa segundo o centra em que foram tratados e o fato de terem ou nao tido derrame recorrente 


Derrame recorrente 


Centro 



Total 


A 

B 

C 

D 


Sim 

16 

12 

21 

12 

61 

Nao 

179 

70 

78 

54 

381 

Total 

195 

82 

99 

66 

442 


O valor calculado de y2 esta associado a (2 - 1) (4 -1) = 3 graus de liberdade. E 10,7603, significante no nrvel de 5%. A 
recorrencia de derrame depende, portanto, do centra (e provavelmente do tratamento prescrito nesse centra) em que o paciente e 
tratado. E correto o pesquisador perguntar: em quais centros a probabilidade de derrames recorrentes e significantemente maior? 
Aplique o procedimento de Marascuilo. 


Primeiro passo : Estabelega a hipotese da nulidade (H 0 ), de que as proporgoes sao iguais em 
todas as categorias. Estabelega a hipotese alternativa (Hj), de que existe pelo menos uma 
proporgao diferente das demais. Estabelega o nrvel de 5% de significancia. 

Segundo passo: Calcule as proporgoes nas diversas categorias. 

Terceiro passo: Calcule as amplitudes crlticas para o procedimento de Marascuilo: 



Pj( l ~Pi) 


( 6 . 2 ) 







Nessa formula: 


i = 1, 2,...,s; 
j = 1, 2 i tj 

X 2 ( s e o valor de /2 com (s - 1) graus de liberdade, no nrvel de significancia considerado. 

Quarto passo: Calcule as diferengas entre as proporgoes observadas duas a duas. Compare cada 
diferenga calculada com a respectiva amplitude crftica. Uma diferenga e estatisticamente 
significante se exceder a amplitude crrtica. 


Exemplo 6.6 

O Exemplo 6.5 apresentou os dados de um estudo multicentrico para testar o efeito de um anti-hipertensivo sobre derrame 
recorrente. O valor calculado de x2, com 3 graus de liberdade, e significante no nrvel de 5%. A recorrencia de derrame depende, 
portanto, do centra medico em que o paciente e tratado. Para comparar centros pelo procedimento de Marascuilo, calcule, 
primeiramente, as proporgbes de derrame recorrente em cada centra medico. 


Derrame recorrente 


Centro medico 


Total 


A 

B 

C 

D 


Sim 

16 

12 

21 

12 

61 

Nao 

179 

70 

78 

54 

381 

Total 

195 

82 

99 

66 

442 

Proporgao com recorrencia 

0,082 

0,146 

0,212 

0,182 

0,138 


Aplicando a formula (6.2), calcule as amplitudes criticas. Primeiro, e preciso obter o valor critico de x2 com 3 graus de liberdade, 
no nrvel de significancia estabelecido (Tabela 2 do Apendice). Para 5%, esse valor e 7,82. Calcule, entao, a raiz quadrada desse 
valor, que e e 2,796. Para obter as amplitudes criticas, faga os diversos calculos intermediaries. Ache, depois, as diferengas entre 
as proporgbes, duas a duas, e compare com as respectivas amplitudes criticas, para estabelecer as significances. 


Calculos intermediaries para obtengao do valor da amplitude crrtica para o procedimento de Marascuilo 


Calculo 

A 

B 

C 

D 

n 

195 

82 

99 

66 

P 

0,082 

0,146 

0,212 

0,182 

1-p 

0,918 

0,854 

0,788 

0,818 

p(i-p) 

0,075319 

0,124926 

0,167126 

0,14876 

p (i—p) / n 

0,000386 

0,001523 

0,001688 

0,002254 


Tabela resumo para o procedimento de Marascuilo 


Comparagao 

Diferenga entre proporgoes 


Amplitude critica 

Significancia 

A e B 

0,06429 


0,122205 

Nao 

A e C 

0,13007 


0,127365 

Sim 


AeD 


Nao 


BeC 

BeD 

CeD 

A proporgao de derrames recorrentes 


0,099767 

0,06578 

0,035477 

0,030303 

Centro C foi significativamente maior 


0,143688 

0,158477 Nao 

0,171871 Nao 

0,175576 Nao 

que no Centro A. 


6.4. TESTE DE /2 DE MANTEL-HAENSZEL 

O teste de x2 de Pearson e aplicado para estabelecer se existe associagao estatrstica entre duas 
variaveis. E possrvel, porem, que um fator estranho ao problema interfira sobre uma das 
variaveis. Lembre-se dos estudos sobre associagao do habito de fumar e cancer do pulmao, como 
aquele relatado no Exemplo 5.3 do Caprtulo 5. Se nao tivessem sido tornados todos os cuidados 
metodologicos, a diferenga estatrstica entre fumantes e nao fumantes poderia ter sido mascarada 
por outros fatores, como idade, por exemplo. Isso teria acontecido se pessoas mais velhas, que 
fumam menos e, ao mesmo tempo, tern mais risco de doengas, tivessem formado o grupo de nao 
fumantes. Neste caso, dirramos que idade foi um fator interveniente, porque teria mascarado o 
efeito do tabagismo sobre o cancer do pulmao. 

Quando existe um fator interveniente, a solugao e “ajustar” o efeito desse fator, fazendo uma 
estratificagao. No caso de a idade estar interferindo no habito de fumar, a solugao seria formar 
diferentes grupos de idade e, em cada grupo, contar quantos fumam e quantos nao fumam. Em 
outras palavras, a solugao seria organizar diversas tabelas 2 \ 2, uma para cada grupo de idade e, 
depois, combinar os resultados em uma so tabela. E isso que faz o teste de y(2 de Mantel- 
Haenszel. 

Indicagao: O teste de x2 de Mantel-Haenszel e um procedimento para estudar a associagao de 
duas variaveis quando e necessario fazer o ajuste para um fator interveniente. 

Exemplo 6.7 

Um pesquisador acompanha um grande grupo de infartados ha 5 anos e tern os dados sobre atividade fisica e a eventual 
recorrencia do infarto nesse grupo. Para saber se a recorrencia de infarto esta associada a atividade fisica regular, organizou os 
dados em uma tabela 2x2. 

Participantes da pesquisa segundo o habito de atividade fisica regular e infarto recorrente 


Atividade fisica regular 


Infarto recorrente 


Sim 

Nao 

Sim 

60 

380 

Nao 

90 

350 


No entanto, o pesquisador suspeita de que a gravidade do primeiro infarto seria um fator interveniente, ou seja, suspeita de que a 
ocorrencia de um segundo infarto possa depender da gravidade do primeiro. Se essa hipotese for verdadeira, a validade do teste 
de x2 de Pearson fica prejudicada porque os grupos em comparaqao podem ser constituidos de pessoas que tiveram infartos com 
gravidades muito diferentes. 

O pesquisador separa, entao, os casos em tres grupos, pela gravidade do primeiro infarto: leve, moderado, severo. Organiza, 
assim, tres tabelas 2 x 2: a primeira apresenta casos de primeiro infarto leve, a segunda, de primeiro infarto moderado e a terceira, 
de primeiro infarto severo. Depois, agrupa as tres tabelas em uma so. 


Participantes da pesquisa segundo a gravidade do primeiro infarto, o habito de atividade fisica regular e infarto recorrente 


Gravidade do infarto 

Atividade fisica regular 

Infarto recorrente 

Total 



Sim 

Nao 


Leve 

Sim 

10 

70 

80 


Nao 

10 

60 

70 

Moderada 

Sim 

20 

160 

180 


Nao 

40 

130 

170 

Severa 

Sim 

30 

150 

180 


Nao 

40 

160 

200 

Total 


150 

730 

880 


Para aplicar o teste de Mantel-Haenszel: 85 

Primeiro passo : Estabeleqa as hipoteses e o nivel de significance. Entao: 

• Hipotese da nulidade: as variaveis sao independentes. 

• Hipotese alternativa: as variaveis nao sao independentes. 

• Nivel de significance: ~ = 5%. 

Segundo passo: Organize nao uma, mas tantas tabelas 2x2 quantos forem os niveis do fator 
interveniente. Por exemplo, se voce estiver estudando a proporqao de pessoas com cancer de 
pulmao em fumantes e nao fumantes, mas suspeita de que a idade possa ser um fator 
interveniente, divida os participantes de pesquisa em k grupos de idade, antes de separar 
fumantes de nao fumantes, com a doenqa e sem a doenqa. Voce tera, em cada grupo de idade, os 
dados a ; ; bf, c ; ; df, i = 1, 2, ..., k. Veja a notaqao literal e simplificada para tabelas 2x2, dada na 
Tabela 5.1 do Caprtulo 5. Vamos repeti-la aqui, como Tabela 6.1, indicando os k estratos (no 
exemplo, grupos de idade). 


Tabela 6.1 - Valores literals em tabela 2x2 estratificada 


Fatorinterveniente 

Grupo 

Caracteristica 




Nao 

Sim 

1 

A 

a i 

b i 


B 

c i 

dr 

2 

A 

a. 

b 2 


B 

c 2 

d 2 


k 

A 

a k 

b k 


B 

c k 

d k 


A formula de calculo para o valor nao corrigido de x2 de Pearson pode ser escrita da seguinte 


forma: 


2 (ad-hcfn 

(a + b)(c + d)(a + c)(b+d) 


(6.5) 


Terceiro passo: Para aplicar o teste de /2 de Mantel-Haenszel, a formula e: 




(a,. +b i )(a i +c f ) 


, (a, + b t )(c t + d t )(a, + c,)(b, + d,) 


( 6 . 6 ) 


Quarto passo : Sob a hipotese de independencia, ou seja, de que nao existe associaqao entre as 
variaveis desde que corrigido o fator interveniente, a estatrstica calculada tern distribuiqao 
aproximada de y2. com 1 grau de liberdade. Compare o valor calculado de x2 com o valor crrtico 
com 1 grau de liberdade e no nrvel estabelecido de significancia (Tabela 2 do Apendice). 


Exemplo 6.8 

Vamos aplicar o teste de de Mantel-Haenzel para os dados do exemplo 6.7. Reveja a formula. Faga: 


e : = 


(«, + b ;){a,+c i ) 


h, = 


(a,. + b, )(c,. + d t ) (a, + c, ) {b t + d,) 


A estatlstica de teste e: 


Xmh 




Calculos intermediaries para obten^ao do Y2 de Mantel-Haenszel 



Leve 

ai 

10 

ei 

10,666667 

(ai - ei) 

-0,666667 

hi 

4,343028 


Gravidade do primeiro infarto 
Moderada 

20 

30,857143 

-10,857143 

12,454009 


Total 


Severa 


30 


33,157895 


-3,157895 

-14,6817 

14,274333 

31,0714 










1 


2 

MH ~ 


(-14.6817) 2 

31,0714 


6,937 


Como o valor calculado de x2 e maior do que o valor critico com 1 grau de liberdade e no nrvel de significancia de 5% (Tabela 2 
do Apendice), conclui-se que existe associagao estatfstica entre atividade fisica regular e recorrencia de infarto. 

Para determinar a diregao da associaqao, foram calculados os percentuais de casos de infarto recorrente entre pessoas que tern e 
que nao tern o habito de realizar atividade fisica regularmente. E facil ver, observando os percentuais de infarto recorrente, que 
atividade fisica faz diminuir significantemente o risco de infarto recorrente. 


Percentuais de casos de infarto recorrente 


Atividade fisica regular 


Gravidade do primeiro infarto 



Leve 

Moderada 

Severa 

Sim 

12,5 

11,1 

16,7 

Nao 

14,3 

23,5 

20 




6.5. TESTE DE y2 PARA TENDENCIA 

Indicagao: o teste de x2 de Pearson e indicado para avaliar a tendencia quando os participantes 
da pesquisa sao classificados segundo duas variaveis, mas uma delas e ordinal ou numerica. Se a 
ordenaqao dos dados nao for levada em conta, 86 a analise estara errada. 


Exemplo 6.9 

A carie dentaria e uma doenga que afeta a todos, indiscriminadamente. A prevengao e extremamente eficaz. No entanto, nas 
periferias, a incidencia de carie e alta porque falta prevengao. Para mostrar que na periferia de Brasilia a proporgao de criangas 
com dentes cariados e alta, uma pesquisadora levantou uma amostra de criangas e as classificou segundo a idade em anos 
completos e o fato de ter ou nao carie. Evidentemente, o numero de criangas com dentes cariados aumenta com a idade. Mesmo 
assim, vamos usar esses dados para mostrar como se faz o teste de x2 se houver tendencia. E dada a proporgao de criangas sem 
carie em fungao da idade em tabela e em diagrama de dispersao. A primeira variavel e discreta e a segunda e nominal. 

Criangas com e sem experiencia de carie segundo a idade em anos completos 


Carie 



Idade em anos 

completos 




7 

8 

9 

10 

11 

12 

Sim 

34 

56 

72 

82 

92 

280 

Nao 

10 

14 

16 

14 

12 

20 

Total 

44 

70 

88 

96 

104 

300 

Proporgao 

0,227 

0,200 

0,182 

0,146 

0,115 

0,067 


Fonte: RIBEIRO, L.D.S.V. Estudo epidemiologico da prevalencia de carie dentaria em criangas da cidade satelite de Guara - DF-Brasrlia. 
Dissertagao. C.P.O. Sao Leopoldo Mandic, 2003. 



Idade em anos completos 

Figura 6.1 - Proporgao de criangas sem carie, segundo a idade, em anos. 

Como o numero de criangas sem caries diminui a medida que a idade aumenta, e possivel ajustar aos dados uma reta, ou seja, 
fazer uma analise de regressao. No entanto, o procedimento nao seria simples porque e necessario levar em conta o fato de as 
proporgoes terem sido estimadas com base em numeros diferentes de criangas. 


De qualquer forma, existe uma alternativa, que mostraremos aqui usando o Exemplo 6.8: 
fazer um teste de x2 para tendencia. Para isso: 

Primeiro passo: 



• Hipotese da nulidade: a proporgao de criangas sem caries nao depende da idade. 

• Hipotese alternativa: a proporgao de criangas sem caries diminui em fungao da idade. 

• Nivel de significance: 5%. 

Segundo passo: Calcule o valor de x2 usando a formula (6.1). O valor calculado de x2 para os 
dados do Exemplo 6.8, com 5 graus de liberdade, e 20,52. O valor crrtico de x2 com 5 graus de 
liberdade e no nivel de significance de 5% e 11,07 (Tabela 2 do Apendice). Logo, a proporgao 
de criangas sem carie depende da idade. 

Terceiro passo: Identifique a variavel ordinal ou numerica do problema. No Exemplo 6.8, a 
variavel idade e numerica, discreta. Atribua um posto (numero de ordem) a cada categoria dessa 
variavel, comegando com 1 e aumentando, de unidade em unidade, ate s (s e o numero de 
categorias dessa variavel). Indique os escores por xi, em que z = 1, 2, 3,..., s. 

Quarto passo: Indique o numero total de individuos em cada categoria da nova variavel por n u , 
em que i = 1, 2, 3,...s. Evidentemente, 5 ni = n, que e o tamanho da amostra. No Exemplo 6.8: 

n = on j = 44 + 70 + 88 + 96 + 104 + 300 = 702 

Indique o numero de individuos com a caracteristica de interesse em cada uma das categorias 
da variavel ordinal por r ; , em que z = 1, 2, 3,... s. No Exemplo 6.8, r i indica o numero de criangas 
sem carie em cada idade. 

Logo: 


5 ri = 10 + 14 + 16 + 14 + 12 + 20 = 86 

Calculos intermediarios para aplicar o teste de y2 para tendencia 


Estatisticas 




Idade 



Total 


7 

8 

9 

10 

11 

12 


Escore 

1 

2 

3 

4 

5 

6 


Sem carie 

10 

14 

16 

14 

12 

20 

86 

Total (rij) 

44 

70 

88 

96 

104 

300 

702 


Quinto passo: Calcule a proporgao de individuos com a caracteristica de interesse em toda a 
amostra. Indique por p. Entao: 

(6.3) 



No Exemplo 6.8: 


Sexto passo: Calcule a estatistica: 87 


p = - 


Xr y 86 
'702 


= 0,1225 


zL- 


I.r l x I -p1n,x l 


p(t~p) 


2 n,x, 




(6.4) 


O valor calculado de y,2 tend tern, aproximadamente, distribuigao de %2 com 1 grau de 
liberdade. 


Continua^ao dos calculos intermediaries para aplicar o teste de Vl para tendencia 


Estatisticas 




Idade 



Total 


7 

8 

9 

10 

11 

12 


Escore (Xj) 

1 

2 

3 

4 

5 

6 


Sem carie (ij) 

10 

14 

16 

14 

12 

20 

orj - 86 

Total (rij) 

44 

70 

88 

96 

104 

300 

n = 702 

r i x i 

10 

28 

48 

56 

60 

120 

orjXj = 322 

n i x i 

44 

140 

264 

384 

520 

1.800 

oitjXj = 3152 

n i x i 2 

44 

280 

792 

1.536 

2.600 

10.800 

5n|X, 2 = 16.052 


Agora, e possivel calcular: 




322- 0,1225x3152 


0,1225(1-0,1225) 16052- 


3152 2 
702 


(-64,15152) 2 = 20,1550 

0,10750x1899,430 


Como o valor calculado de X2 tend com 1 grau de liberdade e maior do que o valor crltico no 
nrvel de 5% de significance com 1 grau de liberdade (Tabela 2 do Apendice), a conclusao e a de 
que a proporqao de crianqas sem caries diminui linearmente com a idade. 

Setimo passo: Calcule a diferenqa entre o %2 de Pearson obtido pela formula (6.1) e o valor de % 
2 tend °btido pela formula (6.4). 

Para o Exemplo 6.8, o teste de ^2 de Pearson calculado anteriormente resultou em 20,52, com 
5 graus de liberdade. O teste de X 2 tend resu ltou em 20,15, com 1 grau de liberdade. A diferenqa 
entre esses dois valores esta associada a 5 - 1 = 4 graus de liberdade e e: 











20,52-20,15 = 0,37 


Essa diferenga tern, aproximadamente, distribuigao de %2. Serve para testar a hipotese de que 
nao existe outra causa de variagao, alem da explicada pela tendencia, para a variagao da variavel 
ordenada. Como o valor calculado e nao significante no nrvel de 5%, conclui-se que a reta e 
apropriada para descrever a variagao da proporgao de criangas sem caries em fungao da idade. 

IMPORT ANTE: 

O valor do % 2 ten( j e sempre menor do que o do yi convencional. O primeiro teste esta associado a 1 grau de liberdade e o 
segundo esta associado a (s - 1) graus de liberdade. O primeiro e mais poderoso, ou seja, tem maior probabilidade de rejeitar a 
hipotese da nulidade quando essa hipotese e falsa. 


RESUMO E OBJETIVO DO CAPITULO 


Depois de estudar este Capitulo, voce deve ser capaz de aplicar e interpretar: 

1. Teste de X 2 para tabelas de contingencia 2 x s, bem como partigao dessas tabelas. 

2. Procedimento de Marascuilo. 

3. Teste de ^2 de Mantel-Haenszel para tabelas 2x2 agregadas. 

4. Teste de ^2 para tendencia. 


83 O teste nao mostrou diferenga entre as drogas, o que nao significa que as drogas tenham o 

mesmo efeito. 

84 MARASCUILO, L.A.; SERLIN, R.C. Statistical Methods for the Social and Behavioral Sciences. Nova York. Freeman, 1988. 

85 Veja SCHORK, M.A.; REMINGTON, R.D. Statistics with Applications to the Biological and Health Sciences. 3. ed. Upper 
Saddle River: Prentice Hall, 2000. p. 216-220. 

86 Veja ALTMAN, D.O. Practical Statistics for Medical Research. 2 nd ed. London: Chapman & Hall, 1993. p. 261-265. 

87 Para demonstragao da estatlstica a partir de uma regressao, veja FLEISS, J. Statistical methods for rates and proportions. 2 nd ed. 
New York: Wiley, 1981. p. 144. 




o.o.i. t'ara verincar se a aistriDuigao aos upos sangumeos inaepenae aa ongem, roram ODiiaos os aaaos apreseniaaos na laDeia 

6.2. Faga o teste de yjl. 


Tabela 6.2 - Participantes da pesquisa segundo a origem e o tipo sangufneo 


Origem 


Tipo sanguineo 




o 

A 

B 

AB 

Arabe 

130 

149 

29 

8 

Nao arabe 

417 

292 

94 

17 


Fonte: GARCIA, M.V. Blood groups and dermatogliphics in a Brazilian population of arabian origin. Cienc Cult 29(7):826-829, 1977. 

6.6.2. Foi feito um estudo transversal de 976 formularios de registro de dados dos casos atendidos pelo SOS Crianga, conclui'dos 
em 1993. Desses, 587 referiam-se a denuncias de maus-tratos. As denuncias foram classificadas em confirmadas e nao 
confirmadas, segundo o perfil do notificante. Os dados estao na Tabela 6.3. Faga o teste de %2. 


Tabela 6.3 - Denuncias confirmadas e nao confirmadas segundo o perfil do notificante 


Perfil do notificante 


Denuncia 



Nao confirmada 

Confirmada 

Total 

Familiares 

141 

50 

191 

Amigos e vizinhos 

140 

22 

162 

Anonimo 

84 

14 

98 

Desconhecido 

55 

6 

61 

Profissionais 

22 

3 

25 

A propria crianga 

20 

2 

22 

Outros 

24 

4 

28 

Total 

486 

101 

587 


Fonte: GONQALVES, H.S. et al. Avaliagao de servigo de atengao a criangas vitimas de violencia domestica. Rev Saude Publica 33(6): 547-553, 
1999. 

6.6.3. Para estudar se existe associagao entre disfungao craniomandibular e nfvel de renda em portadores de proteses duplas, um 
pesquisador levantou os dados apresentados na Tabela 6.4. Algumas frequences esperadas podem ter, no entanto, valor 
menor do que 5. Verifique e, se isso realmente ocorrer, de uma sugestao de procedimento ao pesquisador. 

Tabela 6.4 - Distribuigao de portadores de proteses duplas segundo o nfvel de renda, em salarios minimos (SM), e o grau de 

disfungao craniomandibular 


Nivel de renda Grau da disfungao craniomandibular 



Nenhuma 

Leve 

Moderada 

Severa 

Menos de 5 SM 

19 

21 

10 

0 

De 5 a 10 SM 

21 

24 

5 

0 

Mais de 10 SM 

25 

21 

2 

2 


Fonte: MOLLO JR., F.A. et al. Influencia do nlvel socioeconomico sobre a prevalencia de disfungao craniomandibular em pacientes portadores de 
dentaduras duplas. Rev Bras Prot Clin Labor 2(8): 62-65 [s.d]. 


6.6.4. Escolha a alternativa correta para completar a frase: O teste de yi e usado para 


a) estudar a linearidade das variaveis 

b) obter a variancia 

c) verificar se as variaveis sao binomiais 

d) testar a hipotese de independence 

e) calcular a correlagao 

6.6.5. Para comparar a eficacia e a tolerabilidade da combinagao das drogas candesartan cilexetil e hidroclorotiazida com a 
combinagao das drogas losartan e hidroclorotiazida na hipertensao, foi feito um ensaio clinico com 271 pacientes e foram 
obtidos os dados apresentados na Tabela 6.5. Por “paciente controlado” entende-se aquele que, na ultima consulta, tinha 
PAD (pressao arterial diastolica) menor que 90 mmHg na posigao sentado e por “respondedor” aquele que tinha PAD 
maior que 90 mmHg, mas havia conseguido diminuigao maior do que 10 mmHg entre a primeira e a ultima consulta. Por 
paciente “nao respondedor” entende-se aquele que nao conseguiu PAD menor que 90 mmHg, nem diminuigao da PAD 
maior do que 10 mmHg entre a primeira e a ultima consulta. Faga o teste de ^2. Depois, faga a partigao. 

Tabela 6.5 - Pacientes segundo a resposta a combinagao de hidroclorotiazida com uma segunda droga 


Segunda Droga 


Resposta do paciente 


Total 


Controlados 

Respondedores 

Nao Respondedor 


Candesartan 

85 

10 

44 

139 

Losartan 

65 

10 

57 

132 

Total 

150 

20 

101 

271 


Fonte: OHMAN, K.P.; MILON, H.; VALNES, K. Eficacia e tolerabilidade do comprimido da combinagao de Candesartan Cilexetil e 
Hidroclorotiazida na hipertensao essencial insuficientemente controlada - comparagao com a combinagao de Losartan e Hidroclorotiazida. Blood 
Pressure 9:214-220, 2000. 


6.6.6. A ANVISA (Agenda Nacional de Vigilancia Sanitaria) disponibiliza na internet um questionario basico sobre a percepgao 
de profissionais da satide a respeito das infecgoes relacionadas a assistencia a saude e a higienizagao das maos. A 
primeira questao nao demografica que trata do assunto em questao e: “Voce recebeu algum treinamento em higienizagao 
das maos?”. Imagine que esse questionario foi entregue a 1.500 profissionais de diferentes tipos, que trabalham em 
diversas instituigoes de uma grande metropole. As respostas, segundo o tipo de profissional, estao na Tabela 6.6. Faga o 
teste de %2. Depois, considerando o tipo do profissional, compare a proporgao de respostas “Nao” usando o 
procedimento de Marascuilo. 

Tabela 6.6 - Respostas segundo o tipo de profissional 


Tipo de profissional Resposta 



Sim 

Nao 

Enfermeiro (E) 

264 

36 

Auxiliar de enfermagem (A) 

254 

46 

Parteira (P) 

258 

42 

Tecnico (T) 

237 

63 

Outros (O) 

262 

38 


6.6.7. A Tabela 6.7 apresenta os dados de uma amostra de 178 usuarios de lentes de contato classificados de acordo com o sexo e 
a idade em que comegaram a usar esse tipo de lente. Os dados trazem alguma evidencia de que sexo e idade em que se 
comega a usar lentes de contato sao dependentes? 


Tabela 6.7 - Usuarios de lentes de contato classificados de acordo com o sexo e a idade em que comegaram a usar esse tipo de 

lente 


Faixa de idade 


Sexo 


Total 


Homens 


Mulheres 


Menos de 15 anos 

2 


8 

10 

De 15 a 19 anos 

38 


93 

131 

20 anos e mais 

22 


15 

37 

Total 

62 


116 

178 


Fonte: BAILEY, N.J. 1968. Contact Lenses design - a survey. Amer J Optom and Arch Amer Acad Optom 45: 96. Apud DANIEL, W.W. Applied 
Nonparametric Statistics. Pacific Grove: Duxbury, 2000. 

6 . 6 . 8 . Para avaliar o conhecimento de estudantes de Medicina e de medicos sobre Etica Medica relacionada a AIDS, foi aplicado 
um questionario a 120 estudantes do curso medico e a 50 medicos. Os estudantes foram divididos em dois grupos, 60 do 
curso basico e 60 do curso clinico, e os medicos tambem em dois grupos, 20 residentes e 30 pos-residentes. A questao “O 
medico cirurgiao HIV-positivo pode continuar exercendo sua profissao?” foram obtidas as respostas 88 apresentadas na 
Tabela 6.8. Faga o teste de yi. 

Nota: esta e uma tabela 4x3; voce aplica a formula (6.1) para encontrar o valor de %2. 


Tabela 6.8 - Respostas a questao: “O medico cirurgiao HIV-positivo pode continuar exercendo sua profissao?” 


Resposta 


Estudante 

Respondente 

Medico 

Total 


Basico 

Clinico 

Residente 

Pos-residente 


Sim 

38 

49 

16 

23 

126 

Nao 

17 

8 

2 

6 

33 

Nao declarou 

5 

3 

2 

1 

11 

Total 

60 

60 

20 

30 

170 


Fonte: SANTOS, O.S.; MENDES, E.V.; UMESAKI, M.C.; SANTOS, C.S.; AMBROSIO, M.R. Conhecimento de etica medica relacionada a AIDS 
entre estudantes de Medicina e medicos da Faculdade de Medicina da Universidade Federal de Uberaba. Revista Bioetica 1 7(1 ):123-114, 2009. 

6.6.9. Sao apresentados na Tabela 6.9 dados relativos ao tamanho do carcinoma de celulas renais e o tipo de detecgao, se 
incidental ou por sintomas. a) Existe associagao entre tamanho do tumor e tipo de detecgao? b) A medida que aumenta o 
tamanho do tumor, aumenta a tendencia de detecgao? 

Tabela 6.9 - Carcinoma de celulas renais segundo o tamanho do tumor, em centimetros, e o tipo de detecgao 


Tamanho 

do tumor 

Incidental 

Tipo de detecgao 

Sintomatico 

De 0,5 a 4 

30 


11 

De 4 a 7 

21 


22 

De 7 a 10 

5 


14 

Maior que 10 

3 


9 

Total 

59 


56 


Fonte: DALLI’OGLIO, M.F. et al. Caracteristicas morfologicas dos carcinomas de celulas renais incidentals. Urologia Clinica. Sao Paulo: Escola 


Paulista de Medicina [s.d.]. 


6.6.10. Para verificar a associagao entre mononucleose infecciosa e amidalectomia, foram Ievantados os dados apresentados na 
Tabela 6.10. O teste deve ser ajustado para a idade, uma vez que os participantes que nao tinham a doenga eram mais 
velhos. Faga o teste. 


Tabela 6.10 - Participantes da pesquisa segundo idade, doenga e amidalectomia 


Idade 

Mononucleose 

Amidalectomia 



infecciosa 

Sim 

Nao 


Sim 

6 

17 

18 

Nao 

17 

32 


Sim 

3 

39 

19 

Nao 

26 

70 


Sim 

12 

29 

20 

Nao 

34 

78 


Sim 

8 

38 

21 

Nao 

48 

91 


Sim 

5 

10 

22 

Nao 

45 

73 


Sim 

2 

7 

23 

Nao 

29 

37 


Sim 

4 

5 

24 

Nao 

36 

39 

Fonte: MILLER, R.G.; EFRON, B. 

; BROWN, B.W.; MOSES, L.E. 

Biostatistics casebook. Wiley, 1980 



De acordo com os autores, o medico pode continuar exercendo sua profissao, mas precisa adotar normas de protegao e 
seguranga. 



• • • 



Medidas de Associagao e 
Correla^ao de Spearman 



Medidas de associagao sao coeficientes que medem a forga da relagao estatistica entre variaveis, 
mas nao medem a significance estatistica. Algumas associates sao conhecidas e ja foram 
absorvidas. Por exemplo, as pessoas associam, sem maiores discussoes, tabagismo ao cancer de 
pulmao e risco de acidente de carro ao motorista alcoolizado. Outras vezes, a associaqao entre 
duas variaveis gera polemica. Lembre-se da questao dos resultados no Exame Nacional do 
Ensino Medio (ENEM) e do desempenho dos estudantes na universidade. Existe interesse em 
estudar a associaqao entre essas variaveis, mas nao existe consenso na interpretaqao dos 
resultados. 



7.1. MEDIDAS DE ASSOCIAgAO EM TABELAS 2x2 

Para medir o grau de associagao entre duas variaveis nominais apresentadas em tabelas 2x2, 
vamos ver duas medidas de associagao: o coeficiente fi e o coeficiente gama. 

7.1.1. Coeficiente FI 

O coeficiente fi, que se indica pela letra grega $ Fle-se fi), e muito usado por pesquisadores das 
areas de psicologia e sociologia. Funciona bastante bem quando o estudo e transversal, mas nao e 
tao bom no caso de estudos prospectivos e retrospectivos. Esse coeficiente e definido pela 
formula: 



(7.1) 


em que %2 e o valor obtido pelo teste nao corrigido de p e n e o tamanho da amostra. O valor 
do coeficiente $ varia entre 0 e 1, isto e, 


oi S ii. 


Voce interpreta o resultado do coeficiente $ da seguinte forma: 

1. Quanto mais proximo de 1 estiver o valor de $, maior sera o grau de associagao entre as 


variaveis. 


2. Quanto mais proximo de 0 (zero) estiver o valor de $, menor sera a associagao entre as 
variaveis. 

3. $ = 1 significa associagao perfeita. 89 

4. $ = 0 significa associagao nula. 

5. Como regra pratica, valores de $ menores do que 0,30 ou 0,35 podem ser tornados como 
indicadores de associagao trivial 90 entre as duas variaveis. 

Voce deve estar se perguntando: devo calcular um coeficiente de associagao, se ja apliquei um 
teste de %2 para verificar a significance dos resultados? A resposta e sim. Existe a possibilidade 
de o teste estatrstico ser significante e a associagao entre as variaveis ser fraca. Isso acontece 
porque o teste de %2 - como todo teste, alias - sofre a influence do tamanho da amostra. 
Quanto maior for a amostra, maior sera a probabilidade de encontrar resultados significantes. 

Por outro lado, o grau de associagao e fungao somente das proporgoes observadas. Se a 
amostra for pequena, existe a possibilidade de o teste estatistico ser nao significante e haver 
associagao entre variaveis. Pense em uma tabela de contingencia 2 \ 2: se voce mantiver as 
proporgoes e aumentar o tamanho da amostra, nao mudara o o grau de associagao, mas estara 


aumentando a probabilidade de significancia estatlstica. 


Exemplo 7.1 

Foi feito um levantamento 91 para verificar se a anodontia partial (ausencia congenita de um ou mais dentes) esta associada ao 
sexo. Como os dados foram obtidos por estudo transversal, e recomendavel calcular a distribuigao percentnal. 

Escolares segundo sexo e anodontia partial (ausencia congenita de um ou mais dentes) (porcentagens entre parenteses) 


Sexo 


Anodontia parcial 

Total 


Sim 

Nao 


Masculino 

5 (1%) 

270 (54%) 

275 (55%) 

Feminino 

10 (2%) 

215 (43%) 

225 (45%) 

Total 

15 (3%) 

485 (97%) 

500 (100%) 


Para testar a hipotese de que anodontia partial independe de sexo, aplica-se o teste de yj2. Usando a formula (5.1) do Capitulo 5, 
temos: 


__ 2 _ (5x 215-10 x270) 2 500 

X ~ (5+270)(l0 + 215)(5 + 10)(270+215) 


2,93 


O valor calculado de yi com 1 grau de liberdade e menor do que o valor critico no nivel de 5% de significancia (Tabela 2 do 
Apendice). Nao ha, portanto, evidencia de que anodontia partial esteja associada ao sexo. Um programa para computador fornece 
p-valor igual a 0,0868. 

O coeficiente de associagao $, calculado pela formula (7.1), e 



=^0,00587 =0,0766 


O grau de associagao medido pelo coeficiente $ entre sexo e anodontia partial e pequeno, trivial. Entao, com base nessa 
amostra, nao ha razao para considerar que o risco de anodontia partial esteja associado ao sexo. 


Para fazer os calculos, voce sempre pode usar um programa de computador. Note, porem, que 
alguns programas calculam $ rp (phi-square ), ou seja, o valor de fi ao quadrado - e nao o valor 
de $ apresentado aqui. Consulte sempre o manual do programa para saber que estatlsticas estao 
sendo calculadas. Usando o programa Statistica, voce obtera, para os dados do Exemplo 7.1: 



Column 1 

Column 2 

Row Totals 

Frequencies, row 1 

5 

270 

275 

Percent of total 

1,000% 

54,000% 

55,000% 

Frequencies, row 2 

10 

215 

225 

Percent of total 

2,000% 

43,000% 

45,000% 

Column totals 

15 

54,000% 

55,000% 

Percent of total 

3,000% 

97,000% 


Chi-square (df=l) 

2,93 

p = ,0868 







V-square (df=l) 
Yates corrected Chi-square 
Phi-square 


2,93 

2,1 

0,00587 


p = ,0871 
p = ,1473 


Exemplo 7.2 

Reveja o Exemplo 7.1. Considere agora que o pesquisador tenha obtido urna amostra nao de 500 escolares, mas de 2.000, com a 
mesma distribuigao percentual. 


Distribuigao de escolares segundo sexo e anodontia parcial 


Sexo 


Anodontia parcial 

Total 


Sim 

Nao 


Masculino 

20 (1%) 

1.080 (54%) 

1.100 (55%) 

Feminino 

40 (2%) 

860 (43%) 

900 (45%) 

Total 

60 (3%) 

1.940 (97%) 

2.000 (100%) 


Para testar a hipotese de que anodontia parcial independe de sexo, aplica-se o teste de %2. Usando a formula (5.1) do Capltulo 5, 
vem: 


, (20x 860-1.080 x40) 2 2.000 

Y 2 = --- - - = 1173 

(20+1.080)(40 + 860)(20 + 40)(l.080+860) 

Como o valor calculado de yj2 com um grau de liberdade e maior do que o valor cri'tico no nlvel de 5% de significancia (Tabela 
2 do Apendice), pode-se afirmar que a anodontia parcial esta associada ao sexo. Se voce usar um programa para computador, 
obtera p-valor igual a 0,0006. O valor do coeficiente de associagao $ obtido pela formula (7.1) e: 


/U73 = j 0 Q587 =0 0?66 

V2.000 V 

Veja bem: a associagao entre anodontia parcial e sexo e apenas trivial - apesar de o resultado do teste de J rp ter sido significante 
no nfvel de 5%. 


Compare os Exemplos 7.1 e 7.2: as proposes (dentro das celulas) sao iguais nos dois 
exemplos, mas a amostra do Exemplo 7.2 e quatro vezes maior. E o que aconteceu com as 
estatfsticas? O aumento da amostra fez aparecer a significancia estatfstica, embora o grau de 
associagao tenha permanecido o mesmo e - no caso - bastante pequeno. 

Isso acontece porque, quando o tamanho da amostra aumenta, aumenta a probabilidade de 
encontrar valor estatisticamente significante. No entanto - desde que a distribuigao seja a mesma 
(as mesmas proporgoes nas celulas) o grau de associagao entre as variaveis permanecera o 
mesmo. Portanto, cuidado com a conclusao de estudos transversals com grandes amostras: a 
associagao pode ser trivial, mesmo que haja significancia estatfstica. 

E importante observar que: 







• O teste de JJl testa a hipotese de que a associagao entre duas variaveis nominais e 
significante. 

• O coeficiente $ mede o grau de associagao entre duas variaveis nominais. 

• Como sao estatrsticas diferentes - a primeira mede a significance da associagao e a 
segunda, o grau de associagao -, recomenda-se calcular as duas e, depois, discutir os 
resultados. 

7.1.2. Coeficiente gama 

O coeficiente gama, 92 que se indica pela letra grega ° (le-se gama), mede o grau da associagao 
com que duas categorias ordenadas de variaveis tendem a crescer - e, portanto, decrescer - 
juntas. E definido por: 


ad—be 
ad+be 


(7.2) 


em que a, b, c e d sao os valores definidos na Tabela 5.1 do Capitulo 5. O valor do coeficiente 
gama fica entre -1 e +1, inclusive. 


-li ° i+1. 

O coeficiente gama deve ser interpretado como segue: 

• ° = 1: associagao perfeita positiva. 

• ° = -1: associagao perfeita negativa. 

• ° = 0: associagao nula. 

• 0 < ° <1: associagao positiva. 

• -1 < ° <0: associagao negativa. 


Exemplo 7.3 

Foi feito um estudo transversal para verificar se a doenga periodontal (gengivite) esta associada ao habito de fumar. Veja os 
dados: 93 as variaveis estao “ordenadas” em linha, de 0 (nao tem a doenga) a 1 (tem a doen^a); em coluna, de 0 (nao fuma) a 1 
(fuma). 

Participantes de uma pesquisa classificados segundo o habito de fumar e a doenga periodontal (porcentagens entre parenteses) 


Habito de fumar 

Doen^a periodontal 

Total 


Nao 

Sim 


Nao 

18 (37,5%) 

6 (12,5%) 

24 (50,0%) 

Sim 

14 (29,2%) 

10 (20,8%) 

24 (50,0%) 

Total 

32 (66,7%) 

16 (33,3%) 

48 (100%) 




Para testar a hipotese de que a doenga periodontal 94 independe do habito de fumar, aplica-se o teste de %2. Usando a formula 
(5.1) do Capitulo 5, temos: 


(18 X 10 - 6 X 14) 2 48 

Y 2 = -i- - -= 1 50 

(18 + 6)(14+10)(18 + 14)(6+10) ’ 

Como o valor calculado de e menor do que o valor crrtico com 1 grau de liberdade e no nrvel de 5% de significancia (Tabela 
2 do Apendice), nao se pode afirmar que a doenga periodontal esteja associada ao habito de fumar. Um programa para 
computador fornece p-valor igual a 0,2207. 

Para obter o valor do coeficiente ° , aplica-se a formula (7.2). Deve-se lembrar que, neste exemplo, a = 18, b = 6, c = 14 e d = 
10, temos: 


18x10-6x14 96 

' 18 x10 + 6 x14 264 

Veja bem: embora o teste de ^2 seja nao significante no nrvel de 5%, o coeficiente ° aponta associagao positiva, embora 
pequena, entre habito de fumar e doenga periodontal. E, porem, razoavel considerar que uma amostra maior, neste caso, revelaria 
resultado significante. Afinal, o teste de ^2 tem pouco poder 95 quando a amostra e pequena. 

O coeficiente gama varia entre -1 e +1, inclusive, isto e, -1 i ° \ +1. O coeficiente fiG que 
vimos anteriormente, varia entre 0 e 1, isto e, 0 l $ \ 1. Entao, o coeficiente $ mostra o grau da 
associaqao entre duas variaveis nominais, mas o coeficiente ° fornece, tambem, o sentido da 
associaqao. Cuidado, portanto, ao desenhar a tabela para calcular o coeficiente ° , porque, 
invertendo as linhas, o sinal do coeficiente muda (e, evidentemente, a interpretaqao). 

7.1.3. Razao de chances 

A razao de chances (OR) e uma das varias estatisticas que se tornaram muito importantes na 
pesquisa clinica e na tomada de decisoes. E particularmente util porque fornece informaqao clara 
aos clinicos sobre qual e o tratamento que tem as melhores chances de beneficiar o paciente. 

Por definiqao, chance e a razao entre a probabilidade (p) de determinado evento ocorrer e a 
probabilidade (q) de que esse evento nao ocorra. Indica-se chance pela letra w. 

W =P 

q (7.3) 


Evidentemente, p + q = 1. 


Exemplo 7.4 

Lembre-se dos primeiros experimentos de Genetica, conduzidos pelo monge Gregor Mendel. Ervilhas verdes cruzadas com 
ervilhas amarelas produziram ervilhas amarelas, que cruzadas entre si segregaram na proporgao de tres amarelas para cada verde. 
Entao: 

• “a probabilidade de ocorrer ervilha amarela quando se cruzam ervilhas amarelas heterozigotas e de %” e 




a probabilidade de ocorrer ervilha verde e de Vt. 


A chance e 



3 

1 


que se le 3 para 1. Voce tambem pode escrever 3:1. 


Vamos ver, agora, um exemplo ficticio com numeros inteiros para facilitar tanto o calculo 
como a interpretagao do resultado na area de saude. 


Exemplo 7.5 

Imagine que um pesquisador que saber se existe associagao entre a faixa de idade da mae (categorizada como adolescente ou 
adulta) e o peso ao nascer do filho (categorizado como de baixo peso ao nascer ou de peso normal). Para isso, obteve, em uma 
grande maternidade, uma amostra casual simples dos prontuarios de 100 maes adolescentes e 100 maes adultas, primiparas, com 
partos a termo de nascidos vivos. 


Grupo de idade da mae e peso ao nascer do filho 

Grupo de idade da mae Peso ao nascer Total 



Baixo 

Normal 


Adolescente 

40 

60 

100 

Adulta 

10 

90 

100 

Total 

50 

150 

200 


A proporgao de filhos de maes adolescentes com baixo peso ao nascer e: 


40 „ , 

Pi = -=0,4 

1 100 


A proporgao de filhos de maes adolescentes com peso normal ao nascer e: 

,, = ^-= 0.6 

1 100 


Estima-se, entao, que a chance de baixo peso ao nascer para filhos de maes adolescentes seja: 

_ 0.4 _ 4 

~ 0,6 ~ 6 

Le-se “4 para 6”, ou seja, no caso de maes adolescentes a chance e de 4 bebes com baixo peso para 6 com peso normal. Veja a 
Figura 7.1. 

A proporgao de filhos de maes adultas com baixo peso ao nascer e: 



A proporgao de filhos de maes adultas com peso normal ao nascer e: 



0,9 


Estima-se, portanto, que a chance de a mae adulta ter um bebe com baixo peso ao nascer e: 

_ 0 , 1 _ 1 
0,9 9 

Le-se “1 para 9”, on seja, para mulheres adultas, a chance e 1 bebe com baixo peso para 9 com peso normal. Veja a Figura 7.1. 



100 maes 
adolesce ntes 


100 maes 
adultas 


Baixo peso: 
40 


Peso normal: 
60 


Baixo peso: 
10 


Peso normal: 
90 


Chance 4 : 6 


Chance 1 : 9 


Figura 7.1 - Chances: peso ao nascer. 


O interesse da pesquisa e comparar grupos. Essa comparaqao pode ser feita de diversas 
maneiras, 96 mas e comum calcular a razao de chances. 

Razao de chances (odds ratio), que indicaremos pela letra o (de odds), e definida pela 
formula: 



(7.4) 


Exemplo 7.6 



















Reveja o Exemplo 7.5 e considere as chances calculadas. Aplicando a formula (7.4), a razao de chances e: 


4 



9 


O que significa razao de chances igual a 6? A chance de uma mae adolescente ter filho com baixo peso ao nascer corresponde a 6 
vezes a chance da mae adulta. 


Razao de chances 


Grupo 

Peso ao nascer 

Total 

Probabilidade 

Chance 

Razao de chance 


Baixo 

Normal 


Baixo 

Normal 



Adolescente 

40 

60 

100 

0,4 

0,6 

0,666667 

6 

Adulta 

10 

90 

100 

0,1 

0,9 

0,111111 


Total 

80 

120 

200 






A razao de chances e uma medida de associagao. Saiba que: 

1. Quando as duas variaveis sao independentes, a razao de chances e igual a 1 (ou muito 
proximo de 1). 

2. Quanto maior 97 for a razao de chances, maior sera a associaqao entre as duas variaveis. 

3. Nao confunda chance com probabilidade. E, para que isso fique bem claro, lembre-se da 
primeira lei de Mendel: ervilhas amarelas heterozigotas cruzadas entre si segregaram na 
proporqao de tres amarelas para cada verde. Veja: voce tern ar a chance de 3 para 1, mas a 
probabilidade de obter ervilha amarela quando se cruzam ervilhas amarelas heterozigotas e 
de 3 A. 

De qualquer modo, e difrcil entender o que e, exatamente, razao de chances. E essa estatrstica 
tern aparecido muito em trabalhos da area medica. Vamos, entao, ver outro exemplo, agora com 
dados reais. 


Exemplo 7.7 

Foi feito um estudo com 263 adolescentes que necessitaram de consulta psiquiatrica imediata apos apresentarem comportamento 
suicida. Nos 6 meses seguintes, 186 desses adolescentes nao mais apresentaram comportamento suicida. Desses 186 
adolescentes, 86 haviam sido diagnosticados com depressao na primeira consulta psiquiatrica. Mantiveram comportamento 
suicida no periodo de acompanhamento de 6 meses 77 dos 263 adolescentes. Haviam sido diagnosticados com depressao na 
primeira consulta psiquiatrica 45 deles. Qual e a razao de chances para comportamento suicida, considerando o diagnostico de 
depressao na primeira consulta psiquiatrica? 

Dica: Nem sempre e facil construir uma tabela olhando a descrigao de um problema. Minha sugestao e rabiscar um grafico. Veja 
a Figura 7.2. 


263 pacientes 
adolescentes 


\ 



6 meses de 
tratamento 



186 estavam sem 
comportamento suicida 


\ \ 


77 mantiveram 
comportamento suicida 


\ l 


86 com 
depressao na 
I s consulta 


I 


100 sem 
depressao na 
1 a consulta 



45 com 
depressao na 
1 a consulta 


I 


32 com 
depressao na 
1 a consulta 


Figura 7.2 - Chances: sugestao de grafico. 


Distribuigao dos adolescentes 


Comportamento suicida 

Sim 

Depressao 

Nao 

Total 

Sim 

45 

32 

77 

Nao 

86 

100 

186 

Total 

131 

132 

263 


Fonte: GREENFIELD, B.; HENRY, M„ WEISS, M.; TSE, S.M.; GUILE, J.M.; DOUGHERTY, G.; ZHANG, X.; FOMBONNE, E.; LIS, E.; 
LAPALME-REMIS; HARNDEN, B. Previously suicidal adolescents: Predictors of six-month outcome. Journal of the Canadian Association of 
Child and Adolescent Psychiatry 17(4):197-201, 2008. 


Vamos calcular as proporgSes de adolescentes com ou sem depressao na linha de base, que revelaram ou nao comportamento 
suicida nos 6 meses de seguimento. As chances sao calculadas usando a formula (7.3). 


Chances de comportamento suicida persistente, em fungao de ter sido diagnosticada depressao na primeira consulta 


Comportamento suicida 


Frequencia 



I'ropoicao 


Chance 



Depressao 



Depressao 




Sim 

Nao 

Total 

Sim 

Nao 

Total 


Sim 

45 

32 

77 

p 1 = 0,584 

q : = 0,416 

1 

1,406 

Nao 

86 

100 

186 

p 2 = 0,462 

q 2 = 0,538 

1 

0,859 

Total 

131 

132 

263 






A razao de chances e dada pela formula (7.4): 









1,406 

0,859 


1,63 


A chance de comportamento suicida persistente e 1,63 maior se tiver sido diagnosticada depressao na primeira consulta 
psiquiatrica. 


Exemplo 7.8 

Foi levantada a prevalencia de degeneragao macular relacionada com a idade (DMRI) entre homens e mulheres com mais de 55 
anos de idade que estavam sendo atendidos em dois hospitals de referenda em Pernambuco. Os dados sao apresentados em 
seguida. 

Distribuigao de pacientes atendidos em dois hospitals de Pernambuco segundo o sexo e o fato de serem portadores ou nao de 

DMRI 


Sexo 


DMRI 


Total 


Sim 


Nao 


Homens 

46 


94 

140 

Mulheres 

61 


199 

260 


Fonte: SANTOS, L.P.F. et al. DMRI: prevalencia e fatores de risco em dois centros de referenda em Pernambuco. Arq Bras Oftalmol 68(2): 229- 
233, 2005. 

Calcule a proporgao de homens com mais de 55 anos com degeneragao macular relacionada com a idade (DMRI) e a proporgao 
de homens com mais de 55 anos sem essa degeneragao: 

P(H,sim)= — = 0,3286 
140 


P(H,nao)= -= 0,6714 

140 

A chance de homens com mais de 55 anos terem degeneragao macular relacionada com a idade (DMRI) e, de acordo com a 
definigao dada pela formula (7.3): 


0,3286 

0,6714 


= 0,4894 


A chance de mulheres com mais de 55 anos de idade terem degeneragao macular relacionada com a idade (DMRI) e, de acordo 
com a definigao dada pela formula (7.3), 0,3065. Agora fica facil calcular a razao de chances. 


Razao de chances para DMRI em fungao do sexo 


Sexo 


Frequencia 


Proporgao 


Chance 


Homens 



DMRI 



DMRI 

Sim 

Nao 

Total 

Sim 

Nao 

46 

94 

140 

0,3286 

0,6714 

61 

199 

260 

0,2346 

0,7654 


Total 

1 


0,4894 

0,3065 


Razao de chances 


1,5967 » 1,6 


Mulheres 


1 






Total 


46 


94 


140 


A razao de chances e de, aproximadamente, 1,6. O que isso significa? Para a proporgao de 1,6 homem com mais de 55 anos que 
tem degeneragao macular relacionada com a idade (DMRI) ha 1 mulher na mesma condigao, ou seja, ha 16 homens para 10 
mulheres na mesma condigao (os calculos foram aproximados). 


A razao de chances e tambem conhecida como razao dos produtos cruzados. Ha uma 
explicaqao para essa denominagao. Veja: voce calcula, para obter as probabilidades associadas a 
cada evento de uma tabela 2x2: 


Pi = 


a 

a + b 


b 


<h = 

P2 ~ 

<h = 


a + b 

c 

c+d 

d 

c + d 


As chances para os dois grupos, 1 e 2, sao dadas pela formula (7.3): 

a 

a+b 


a+b 

c 

c+d 


c+d 

A razao de chances e dada pela formula (7.4). Entao: 

_ w, _ a b c d _axd 
w 2 a + b a+b c + d c + d bxc 

Veja que a razao de chances fica definida pela formula 

axd 

o =- 

b Xc 


(7.5) 


Entao, para obter a razao de chances, use a formula (7.5), que e bem mais facil. 















Exemplo 7.9 


Reveja os dados apresentados no Exemplo 7.8. 

Distribuigao de pacientes atendidos em dois hospitals de Pernambuco segundo o sexo e o fato de serem portadores ou nao de 

DMRI 


Sexo 


DMRI 


Total 


Sim 


Nao 


Homens 

46 


94 

140 

Mulheres 

61 


199 

260 


Fonte: SANTOS, L.P.F. et al. DMRI: prevalencia e fatores de risco em dois centres de referenda em Pernambuco. Arq Bras Oftalmol 68(2): 229- 
233, 2005. 


Aplicando a formula (7.5), obtem-se a razao de chances: 


46 x 199 
61x94 


9.154 

5.734 


1,5964 


7.1.4. Risco relativo 

Nos estudos prospectivos, o pesquisador acompanha um grupo de pessoas com uma 
caracteristica e um grupo de pessoas sem essa caracteristica por determinado tempo, a espera da 
ocorrencia de um desfecho. Depois, calcula a proporqao de pessoas com o desfecho esperado nos 
dois grupos. Essas proporqoes sao estimativas de probabilidade. 

A probabilidade de perigo com ameaqa fisica ou psicologica para o homem e/ou o meio 
ambiente e denominada risco. Nos estudos prospectivos, a proporqao de pessoas com desfecho 
desfavoravel em determinado grupo e uma estimativa do risco para a ocorrencia desse desfecho 
nesse grupo. 


Exemplo 7.10 

Foi feito um estudo prospective com 1.229 gestantes de Campinas, SP, entre 2004 e 2006, para avaliar os fatores de risco 
comumente associados a desfechos desfavoraveis na saude de recem-nascidos, como baixo peso ao nascer ou prematuridade. 
Veja os dados para um desses fatores - consumo de cigarros durante a gestagao - que permitem estimar riscos. 


Estimativas do risco de baixo peso ao nascer ou prematuridade segundo o consumo ou nao de cigarros durante a gestagao 


Consumo de cigarros durante a gestagao 

Sim 

Nao 

Total 


Baixo peso 

ou prematuridade 

Total 

Risco 

Sim 

Nao 



44 

121 

165 

0,2667 

146 

918 

1.064 

0,1372 

190 

1.039 

1.229 



Fonte: AUDI, C.A.F. et al. Associagao entre violencia domestica na gestagao e peso ao nascer ou prematuridade. J Pediatr (Rio J) 84(1), 2008. 






Risco relativo e a razao entre dois riscos. Procure dividir sempre o maior risco pelo menor 
para facilitar a interpretagao. 

O Exemplo 7.10 mostra que o risco de um nascituro ter baixo peso ao nascer ou 
prematuridade e maior se a mae consumiu cigarros durante a gestagao. No entanto, em quantas 
vezes o risco e maior? No caso do exemplo, o risco relativo e: 


R.R. 


0,2667 

0,1372 


1,94 


isto e, o risco de nascituro com baixo peso ao nascer ou prematuridade praticamente dobra se a 
mae consumir cigarros durante a gestagao. 

Na area da saude, existe muito interesse em conhecer os riscos das doengas e os fatores de 
risco a elas associados (fatores que aumentam o risco de uma pessoa ter determinada doenga). 
No entanto, pelo menos a primeira vista, os estudos retrospectivos nao permitem estimar riscos. 
Nesses estudos, os pesquisadores procuram pessoas com uma doenga - por exemplo, ulcera 
gastrica - e verificam quantas delas estiveram expostas a um fator que presumem de risco - por 
exemplo, consumo abusivo de comida apimentada por longo tempo. Depois, procuram pessoas 
sem a doenga e verificam quantas delas estiveram expostas ao mesmo fator para, depois, fazer 
comparagoes. Entao, nao e possrvel calcular riscos, mas apenas as proporgoes de pessoas que 
foram expostas ao fator, entre casos e controles. 

No entanto - e importante saber -, quando a doenga e de baixa incidencia, a razao de chances 
tern valor proximo ao do risco relativo. Dai a importancia dos estudos retrospectivos: sao 
rapidos, baratos e dao ideia do valor do risco relativo. 


Exemplo 7.11 

Reveja o estudo retrospective) para saber se cancer no pulmao ocorre mais em fumantes, apresentado no Exemplo 5.3 do Capltulo 
5. Como se estima o risco de um fumante ter cancer de pulmao? Calcule a razao de chances, que e uma estimativa do risco 
relativo. Entao, usando a razao de chances como estimativa de risco, podemos dizer que e 14 vezes mais provavel um fumante ter 
cancer do pulmao comparativamente com um nao fumante. 


27 x 647 
2 x 622 


17469 

1244 


14,04 


Participantes da pesquisa segundo ter ou nao cancer de pulmao e ser ou nao fumante 


Cancer no pulmao 

Sim 

Habito de fumar 

Nao 

Total 

Propor^ao de fumantes 

Presente 

27 

622 

649 

0,0416 

Ausente 

2 

647 

649 

0,00308 

Total 

29 

1.269 

1.298 



Fonte: DOLL, R.; HILL, A.B. Smoking and carcinoma of the lung; preliminary report. Br Med J 2(4682): 739-748, 1950. 






7.2. MEDIDAS DE ASSOCIAgAO NAS TABELAS r x s 

Nas diversas areas de ciencias sociais e em epidemiologia, e bastante comum usar medidas de 
associaqao para explicar os achados de uma tabela r x s. Os resultados obtidos nao sao, no 
entanto, de facil interpretaqao. 98 Existem muitas medidas que tern formulas diferentes, 
propriedades diferentes e levam, portanto, a resultados diferentes. Apresentamos aqui algumas 
dessas medidas, todas baseadas no valor de ^2. No entanto, veja essas medidas apenas como 
mimeros que indicam quando uma tabela mostra maior grau de associaqao do que outra." 


7.2.1. Coeficiente FI 

O calculo do coeficiente fi, que se representa pela letra grega $ Fle-se fi), e baseado no valor 
nao corrigido de y2, conforme visto na Seqao 7.1.1. A divisao do valor de y2 por n faz com que 
o valor do coeficiente nao seja influenciado pelo tamanho da amostra. Por definiqao: 


<p = 



Exemplo 7.12 

Reveja os dados apresentados no Exemplo 6.5 do Capltulo 6 e apresentados novamente aqui. O valor de yj2 foi calculado e 
resultou em 10,816, significante no ni'vel de 5%. Como n = 442, obtemos: 


10,816 

442 


0,156 


Portanto, embora o teste estatlstico tenha mostrado significancia, a associagao entre centra e derrame recorrente e pequena. 


Participantes da pesquisa segundo o centro em que foram tratados e o fato de terem ou nao tido derrame recorrente 


Derrame recorrente 


Centro 



Total 


A 

B 

C 

D 


Sim 

16 

12 

21 

12 

61 

Nao 

179 

70 

78 

54 

381 

Total 

195 

82 

99 

66 

442 


Alguns autores definem o coeficiente $ 2 - e nao o coeficiente $. O primeiro e, 
evidentemente, o quadrado do segundo. Se voce estiver usando um programa de computador, 
verifique se e calculado o valor de $ ou o de $ 2 . De qualquer forma, verifique que, para os 
dados do Exemplo 7.12, o valor de $ 2 e: 


$ 2 = 0,0245 







E melhor calcular o valor de $ - e nao de $ 2 - porque assim voce obtem resultados 
comparaveis com os das demais medidas de associaqao dadas nesta seqao. 


7.2.2. Coeficiente de contingencia de Pearson 

O coeficiente de contingencia de Pearson e indicado por P e definido pela formula: 


X + ” 


em que n e o tamanho da amostra. Os coeficientes de associaqao variam entre 0 e 1, mas o 
coeficiente de contingencia de Pearson nao atinge o valor 1 mesmo quando a associaqao e 
perfeita. Matematicamente, seria necessario n = 0, o que nao e possrvel (n e o tamanho da 
amostra). 

Exemplo 7.13 

Reveja os dados apresentados no Exemplo 7.12. O valor de V2 foi calculado e resultou em 10,816. Como n = 442, obtemos: 



O valor obtido para o coeficiente de contingencia e pequeno (porque 0,155 esta proximo de zero), indicando, novamente, pouca 
associaqao entre a ocorrencia de novo derrame e o centro em que o paciente foi tratado. 


7.2.3. Coeficiente de Cramer 

O coeficiente de associaqao para tabelas r x s mais conhecido, e com melhores propriedades, e o 
V de Cramer, dado pela formula: 



em que min{(r - 1), (s - 1)} e o mmimo de (r - 1) e (s - 1). Em outras palavras, compare r e s e 
use, no denominador da formula, o menor deles: ou (r - 1) ou (s - 1). Note que, s = r = 2, o 
coeficiente de Cramer e igual ao coeficiente fi. 


Exemplo 7.14 


Reveja os dados apresentados no Exemplo 7.12. O valor de yi calculado resultou em 10,816 e n = 442. Sao r = 2 linhas e s = 4 
colunas. Entao, o mr'nimo de (r - 1) e (s - 1) e (r - 1) = (2 - 1) = 1. Logo: 









= 0,156 


V = 


( 10,816 

442 


1 


O valor obtido para o coeficiente de contingencia e pequeno, o que indica pouca associa^ao entre as variaveis em analise. 




7.3. COEFICIENTE DE CORRELAgAO DE SPEARMAN 

Vimos, ate aqui, medidas de associagao entre duas variaveis nominais. No entanto, pode haver 
interesse em estudar o grau da correlagao entre variaveis ordinais e entre variaveis numericas. A 
medida de correlagao mais conhecida e o coeficiente de correlagao de Pearson, 100 que mede o 
grau de correlagao entre duas variaveis numericas. 

Existe, porem, uma alternativa nao parametrica para o coeficiente de correlagao de Pearson. 
E o coeficiente de correlagao de Spearman, que deve ser usado quando os dados observados sao 
ordinais ou quando as variaveis numericas em analise nao tern distribuigao normal 
bidimensional. Para calcular o coeficiente de correlagao de Spearman: 

Primeiro passo: Converta os valores observados das duas variaveis em postos. 

Segundo passo: Calcule a diferenga D entre cada par de postos, isto e, calcule a diferenga entre o 
posto de Ye o posto de X para a mesma unidade. Se os calculos estiverem corretos, 5 D, isto e, o 
somatorio dessas diferengas, devera ser igual a zero. 

Terceiro passo: Calcule o quadrado de cada diferenga (D 2 ) e depois faga o somatorio, isto e, 
calcule 5 D 2 . 

Quarto passo: Calcule o coeficiente de correlagao de Spearman usando a formula: 


6 £d 2 

4 ^ 


Nessa formula, rseo coeficiente de correlagao de Spearman, De a diferenga entre os postos 
de uma mesma unidade ene o numero de pares de unidades da amostra. 

Quinto passo: Como o coeficiente de correlagao varia entre -1,00 (correlagao perfeita negativa) e 
+1,00 (correlagao perfeita positiva), voce pode testar a hipotese da nulidade de que, na 
populagao, as variaveis X e Y nao estao correlacionadas. Escolha uma das seguintes alternativas: 

• X e Y tern correlagao (hipotese bilateral, porque essa correlagao tanto pode ser positiva como 
negativa). 

• X e Y tern correlagao positiva (hipotese unilateral, porque a correlagao so podera ser 
positiva). 

• X e Y tern correlagao negativa (hipotese unilateral, porque a correlagao so podera ser 
negativa). 

Sexto passo: Compare o valor calculado de r s com o valor crrtico dado na Tabela 11 do 
Apendice. Essa tabela fornece valores crrticos tanto para testes unilaterais como bilaterais, para 
os nrveis de significance ~ = 0,05 e ~ = 0,01. Rejeite a hipotese de que nao ha correlagao entre 
as variaveis toda vez que o valor calculado de r s for maior do que o valor crrtico. Entretanto, e 
melhor usar um programa de computador para fazer esse teste: alem de mais seguro, o programa 





fornece o p-valor. 

Quando nao ocorrem empates, o coeficiente de correlagao de Spearman tem o mesmo valor 
do coeficiente de correlagao de Pearson calculado com os postos - e nao com os dados originais. 
Se existem empates, os resultados sao diferentes, mas muitas vezes a diferenga e desprezrvel. 


Exemplo 7.15 

Foram obtidos escores de ansiedade por meio de um questionario (Spielberger State Trait Anxiety Inventory) e da pressao 
sistolica, em milimetros de mercurio, de pacientes antes de exodontias multiplas. Os dados estao apresentados em tabela e em 
diagrama de dispersao. 


Escores de ansiedade e pressao sistolica 


Ansiedade 

Pressao sistolica 

43,0 

139,7 

51,2 

160,0 

41,0 

130,0 

48,2 

150,0 

37,1 

120,0 

48,8 

155,0 

37,6 

125,0 

45,8 

150,0 

34,8 

120,0 


Fonte: OLIVEIRA, J.A.G.P.; GUIMARAES, E.C.; OLIVEIRA, L.S. Avaliagao da ansiedade e dos parametros cardiovasculares em pacientes 
hipertensos submetidos ao uso da pre-medicagao Diazepam e da solugao anestesica Bupivacaina (Neocaina a 0,5% sem epinefrina) em exodontias 
multiplas. Estudo duplo-cego. Rev ABO Nac 7(2): 96-99, 1999. 

Vamos optar pelo coeficiente de correlagao de Spearman, uma vez que escores de ansiedade nao tem distribuigao normal e a 
amostra e pequena. 
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Figura 7.3. Medidas de ansiedade e pressao sistolica. 

Primeiro passo: Atribua postos as medidas de ansiedade e as medidas de pressao sistolica. Como ha valores iguais de pressao 
sistolica, houve empates. Atribua, aos valores iguais, posto igual a media dos postos que seriam ocupados por eles caso nao 
fossem iguais (nao houvesse empate). 



Calculos intermediaries 


Ansiedade 

Pressao sistolica 

Posto para X 

Posto para Y 

D 

D 2 

43 

139,7 

5 

5 

0 

0 

51,2 

160 

9 

9 

0 

0 

41 

130 

4 

4 

0 

0 

48,2 

150 

7 

6,5 

-0,5 

0,25 

37,1 

120 

2 

1,5 

-0,5 

0,25 

48,8 

155 

8 

8 

0 

0 

37,6 

125 

3 

3 

0 

0 

45,8 

150 

6 

6,5 

0,5 

0,25 

34,8 

120 

1 

1,5 

0,5 

0,25 


Segundo passo: Calorie a diferenq:a entre cada par de postos, que indicaremos por D. Por exemplo, a diferenq:a entre os postos 
conferidos ao quarto paciente e 6,5 - 7 = - 0,5. Nao e necessario calcular 5D, mas essa soma permite verificar se o calculo feito 
anteriormente esta correto, uma vez que 5 D e, necessariamente, igual a zero. 

Terceiro passo: Calcule o quadrado de cada diferenqa (D 2 ) e depois some (o D 2 ). Para a Tabela 7.14, o somatorio dos quadrados 
de D e: 


5 D 2 = 1 


Quarto passo: Usando a formula, calcule o coeficiente de correlaqao de Spearman: 


6x1 

9x(9 2 -l) 


=0,99167 


Quinto passo: Para um teste bilateral com ~ = 0,05 e n = 9, a Tabela 11 do Apendice da o valor critico: 0,6833. Como o valor 
absoluto de r s calculado com base na amostra e maior do que o valor dado na tabela (0,99617 > 0,6833), voce rejeita a hipotese 
da nulidade. Em outras palavras, a medida de ansiedade obtida por meio de questionario esta correlacionada com a pressao 
sistolica. 


Se voce usar um programa de computador para fazer os calculos, vera que o teste estatlstico e 
feito pelo teste t. No entanto, voce ja sabe como tirar as conclusoes. O Statistica, por exemplo, 
dara os resultados: 


Spearman Rank Order Correlations 

Valid N 


Ansiedade e pressao sistolica 


9 


Spearman R 

0,991632 


t (n-2) 

20,32237 


p-level 

l,75E-07 





RESUMO E OBJETIVO DO CAPITULO 


Depois de estudar este Capitulo, voce deve ser capaz de calcular e interpretar: 

1. Medidas de associagao para dados apresentados em tabelas 2x2. 

2. Medidas de associagao para dados apresentados em tabelas r x s. 

3. Coeficiente de correlagao de Spearman. 


89 Este valor, porem, so ocorre quando as amostras sao de mesmo tamanho. 

90 Veja FLEISS, JL. Statistical methods for rates and proportions. 2 nd ed. New York: Wiley, 198t. p. 60. 

91 Dados fictlcios criados com base no trabalho de VEDOVELO, M. Prevalencia de agenesias dentarias em escolares de 
Piracicaba. Dissertagao de mestrado. FOPUnicamp, 1972. 

92 O coeficiente ° tambem e conhecido como coeficiente de Yule. 

99 Dados fictlcios com base em NARCISO DA CRUZ, C.M. Estresse e fumo como fatores de risco para doenga periodontal. 
Dissertagao. Universidade Camilo Castelo Branco, 2000. 

94 Doenga da gengiva. 

95 Probabilidade de rejeitar a hipotese da nulidade quando a hipotese alternativa e verdadeira. 

96 Alguns autores consideram que calcular a diferenga entre as chances seria mais adequado, mas a razao de chances ja se 
popularizou entre pesquisadores da area de saude. 

97 A razao de chances pode ter valores altos: veja o exemplo 7.11, em que a razao de chances chega a 14,04. 

98 HILDEBRAND, D.K.; LAING, J.D.; ROSENTHAL, H. Prediction analysis of cross classifications. Nova York: Wiley, 1977. 
p.49. 

99 BISHOP, Y.M.M.; FIENBERG, S.E.; HOLLAND, P.W. Discrete multivariate analysis: Theory and Practice. Cambridge, 
Massachussets: The Mit Press, 1977. 

108 Veja, por exemplo: VIEIRA, S. Introdugao a Bioestatistica. 4. ed. Rio de Janeiro: Campus-Elsevier, 2008. 




/ai. verguniou-se a 4J pessoas se eias acreanavam em noroscopos e em seres extraierrestres. Lom os aaaos aa raDeia /.i, 
calcule o coeficiente $ (fi) e interprete. 

Tabela 7.1 - Distribui^ao dos entrevistados segundo aquilo em que acreditam 

Extraterrestre Horoscopo 

Sim 

Sim 14 

Nao 6 

Fonte: http://flowjo.typepad.com/the_daily_dongle/files/Phi-coefficient.pdf 

7.4.2. Com base nos dados apresentados na Tabela 7.2, faga o teste de e calcule o coeficiente de associagao fi. Interprete o 
resultado. 

Tabela 7.2 - Escolares distribuldos de acordo com o genero e a presenga ou nao de habitos orais nocivos 


Sexo 


Habitos orais nocivos 


Total 


Sim 


Nao 


Masculino 

450 


582 

1.032 

Feminino 

535 


449 

984 

Total 

985 


1.031 

2.016 


Fonte: SILVA FILHO, O.G. et al. Habitos de suc^ao e ma oclusao: epidemiologia na dentadura decidua. R Clin Ortodon Dental Press 2(5): 57-74, 
2003. 

7.4.3. Por meio de inquerito domiciliar, foram entrevistadas 200 mulheres da localidade de Puerto Leoni, Misiones, Argentina, 
sobre o exame Papanicolaou. As respostas sobre a escoiaridade dessas mulheres e sobre o conhecimento delas a respeito 
do exame Papanicolaou sao apresentadas na Tabela 7.3. Fa^a o teste de e calcule o coeficiente de associagao gama. 

Tabela 7.3 - Conhecimento das mulheres sobre o Papanicolaou em fungao da escoiaridade 


Escoiaridade 


Conhecimento 



Inadequado 


Adequado 

6 anos ou menos 

60 


43 

7 anos ou mais 

39 


58 


Fonte: GAMARRA, C.J. et al. Conhecimentos, atitudes e pratica do exame Papanicolaou entre mulheres argentinas. Rev Saude Publica 39(2): 270- 
276, 2005. 


7.4.4. Com base nos dados apresentados na Tabela 7.4, calcule riscos, risco relativo e faga o teste de yjl. 


Tabela 7.4 - Obito neonatal e diabetes melito 


Nao 

10 

13 


Diabetes melito Obito neonatal 

Sim Nao 

Sim 3 21 

Nao 21 830 

Fonte: CUNHA, A.A.; PORTELA, M.C.; AMED, A.M.; CAMANO, L. Diabetes mellitus tipo 1 (insulino-dependente) e gravidez: conduta 
obstetrica e resultado perinatal. Go Atual 6(5): 24-26, 2001. 


7 . 4 . 5 . Para comparer a eficacia e a tolerabilidade da combinagao de candesartan cilexetil e hidroclorotiazida com a combinagao 
de losartan e hidroclorotiazida na hipertensao, foram obtidos os dados apresentados na Tabela 7.5. Por “paciente 
controlado” entende-se aquele que, na ultima consulta, tinha PAD (pressao arterial diastolica) menor que 90 mmHg na 
posigao sentado e por “respondedor” aquele que tinha PAD maior que 90 mmHg, mas havia conseguido diminuigao 
maior do que 10 mmHg entre a primeira e a ultima consulta. Por paciente “nao respondedor” entende-se aquele que nao 
conseguiu PAD menor que 90 mmHg, nem diminuigao da PAD maior do que 10 mmHg entre a primeira e a ultima 
consulta. Calcule coeficientes de associagao e compare os resultados. 

Tabela 7.5 - Pacientes segundo a resposta ao tratamento e a combinagao de drogas 

Paciente Combinagao de drogas 

Candesartan + hidroclorotiazida Losartan + hidroclorotiazida 

Controlados 85 65 

Respondedores 10 10 

Nao respondedores 44 57 

Fonte: OHMAN, K.P.; MILON, H.; VALNES, K. Eficacia e tolerabilidade do comprimido da combinagao de Candesartan Cilexetil e 
Hidroclorotiazida na hipertensao essencial insuficientemente controlada - comparagao com a combinagao de Losartan e Hidroclorotiazida. Blood 
Press 9(4): 214-220, 2000. 


7 . 4 . 6 . Imagine que voce obteve as medias de oito alunos de uma faculdade, em aulas teoricas (X) e em aulas praticas (Y). Os 
dados estao na Tabela 7.6. Calcule o coeficiente de correlagao de Spearman. 

Tabela 7.6 - Medias de oito alunos de uma faculdade em aulas teoricas (X) e em aulas praticas (Y) 


Aluno 

X 

Y 

1 

30 

60 

2 

55 

55 

3 

65 

45 

4 

80 

90 

5 

85 

50 

6 

45 

85 

7 

50 

80 

8 

60 

95 


7 . 4 . 7 . Sao dadas 101 as notas de tres juizes aos trabalhos de 10 artistas. Calcule o coeficiente de correlagao de Spearman para cada 
par de juizes e decida: a) quais sao os dois juizes que tern opinibes mais parecidas? b) quais sao os dois juizes que tern 
opinibes mais diferentes? 


fuiz A: 5; 8; 4; 2; 3; 1; 10; 7; 9; 6. 

Juiz B: 3; 10; 1; 4; 2; 5; 6; 7; 8; 9 
luiz C: 8; 5; 6; 4; 10; 2; 3; 1; 7; 9. 

7 . 4 . 8 . Foi feito um levantamento de sintomas depressivos com estudantes de ambos os sexos com idades entre 10 e 17 anos. A 
avaliagao foi feita por meio do questionario de autoavaliagao denominado Children’s Depression Inventory (CDI). Com 
base nos dados apresentados na Tabela 7.7, faga o teste de e calcule medidas de associagao. 


Tabela 7.7 - Distribuigao dos participantes da pesquisa segundo o sexo e a presemja de sintomas depressivos 


Sexo 


Sintomas depressivos 



Sim 


Nao 

Masculino 

26 


168 

Feminino 

68 


201 


Fonte: BAHLS, S.C. Epidemiology of depressive symptoms in adolescents of a public school in Curitiba, Brazil. Rev Bras Psiquiatr 24(2): 63-67, 
2002 . 

7 . 4 . 9 . Foi feito um questionario 102 para saber o que mais contribui para a felicidade das pessoas: amigos e vida social, trabalho e 
hobby ou condiqao fisica e saude. Responderam ao questionario 80 pessoas solteiras, 120 casadas e 100 viuvas ou 
divorciadas. Os resultados estao apresentados na Tabela 7.8. Faqa um teste estatistico e calcule uma medida de 
associagao. 


Tabela 7.8 - O que mais contribui para a felicidade segundo o estado civil das pessoas 


Alternativa 



Estado civil 


Solteiro 

Casado 

Viuvo ou divorciado 

Amigos e vida social 

41 

49 

42 

Trabalho e hobby 

27 

50 

33 

Saude e condigao fisica 

12 

21 

25 

Total 

80 

120 

100 


7 . 4 . 10 . Foi feito um estudo transversal de 976 formularios de registro de dados relativos a casos atendidos pelo SOS Crianga e 
concluidos em 1993. Desses, 587 referiam-se a denuncias de maus-tratos. As denuncias foram classificadas em 
confirmadas e nao confirmadas, segundo o perfil do notificante. Os dados estao na Tabela 6.3 do Capitulo 6. Existe 
associagao entre demincia confirmada e perfil do denunciante? 


101 FREUND, J.E.; SMITH, R.M. Statistics: a first course. 4 th ed. Englewood Cliffs: Prentice Hall, 1970. p. 48. 

102 FREUND, J.E.; SMITH, R.M. Statistics: a first course. 4th ed. Englewood Cliffs: Prentice Hall, 1970. p. 389. 



• • • 



Outras Estatisticas 



Este Caprtulo cobre alguns assuntos usuais na literatura da area de saude que nao foram tratados 
nos caprtulos anteriores, como os testes diagnostics, a concordancia entre examinadores e o 
numero necessario tratar. Esses assuntos tern, em comum, a matematica relativamente simples. 



8.1. TESTES DIAGNOSTICOS 


Para entender como uma doenga se transmite e para dar cuidados medicos efetivos, e preciso 
saber quern esta doente e quern nao esta doente. O diagnostico da doenqa - seja por exame 
clinico, por exame laboratorial, por imagem ou por uma combinaqao de exames - precisa 
responder a pergunta: “O paciente esta doente ou nao esta doente?”. A qualidade dos testes 
diagnosticos e, portanto, fundamental. 

Muitas pesquisas sao feitas com a finalidade de melhorar as tecnicas de diagnostico. A analise 
estatrstica dessas pesquisas nao e dificil, mas a terminologia usada na area e muito especrfica. 
Vamos ver aqui os testes diagnosticos que so podem resultar em positivo ou negativo. Por 
exemplo, se um medico suspeita de que seu paciente esteja infectado por HIV, pede um exame 
de laboratorio. O resultado pode ser “positivo” ou “negativo”. E razoavel pensar que, se o 
resultado do exame der positivo, o paciente esta infectado e, se der negativo, o paciente nao esta 
infectado. No entanto, e preciso considerar a possibilidade de o teste ter dado resultado errado. 

O medico precisa ter uma estimativa da probabilidade de erro dos testes diagnosticos, isto e, 
uma estimativa da probabilidade de obter um resultado positivo para quern nao tern a doenqa e 
da probabilidade de um resultado negativo para quern tern a doenqa. Vamos ver a terminologia 
usada na area. Dizemos que o resultado do teste e: 

• Verdadeiro-positivo (VP): quando detecta a doenqa em quern tern a doenqa. 

• Falso-negativo (FN): quando nao detecta a doenqa em quern tem a doenqa. 

• Verdadeiro-negativo (VN): quando nao detecta a doenqa em quern nao tem a doenqa. 

• Falso-positivo (FP): quando detecta a doenqa em quern nao tem a doenqa. 

Para estimar a probabilidade de ocorrerem falsos-positivos ou falsos-negativos em testes 
diagnosticos, sao feitos grandes levantamentos de dados. Entao, se rq doentes forem submetidos 
a determinado teste, teremos VP verdadeiros-positivos e FN falsos-negativos. Se n 2 voluntaries 
nao doentes forem submetidos a esse teste, teremos VN verdadeiros-negativos e FP falsos- 
positivos. 

Os resultados para um teste diagnostico dicotomico (positivo ou negativo) sao apresentados 
em tabelas de contingencia. Colocamos os resultados do teste (positivo ou negativo) nas linhas e 
o fato de a doenqa estar ou nao presente nas colunas. Veja a Tabela 8.1 e a Figura 8.1. 


Tabela 8.1 - Resultados do teste diagnostico 


Resultado 

Sim 

Doen^a 

Nao 

Positivo 

VP 


FP 

Negativo 

FN 


VN 

Total 

n l 


n 2 


Verdadeiro-positivo 



Falso-positivo 


Verdadeiro-negativo 


Falso-negativo 


Figura 8.1 - Teste diagnostico. 


Sensibilidade (S) do teste: e a proporgao de verdadeiros-positivos (resultados positivos 
corretos) no total de pessoas com a doenga. 

VP 
S =— 
n i 

Especificidade (E) do teste : e a proporgao de verdadeiros-negativos (resultados negativos 
corretos) no total de pessoas sem a doenga. 


E 


VN 

n 2 


Exemplo 8.1 

Considere que um teste diagnostico para detectar determinada doenga foi aplicado em 1.000 participantes de pesquisa: 400 
tinham a doenga e 600 nao tinham a doenga. Os resultados do teste foram positivos em 380 doentes e negativos em 360 
participantes sem a doenga. 


Resultados do teste diagnostico 


Resultado 

Sim 

Doen^a 

Nao 

Total 

Positivo 

380 


240 

620 

Negativo 

20 


360 

380 

Total 

400 


600 

1.000 


5 

E 


380 

400 

360 

600 


= 0,95 

= 0,60 


O teste e senstvel, porque a probabilidade de dar resultado positivo quando a pessoa tern a doenga e alta (acertou em 95% dos 
casos da amostra). Entretanto, o teste nao e especifico, porque a probabilidade de dar negativo em pessoas que nao tern a 















doenga e relativamente baixa (acertou em 60% dos controles da amostra). 


Qual e o problema com os testes sensrveis? A probabilidade de ocorrerem falsos-positivos e 
alta. No Exemplo 8.1, a probabilidade estimada de falsos-positivos e 


240 

620 = 0,387 


Se o teste e sensivel, uma pessoa que nao tem a doenga pode receber a informagao de que tem 
a doenga. Escolha um teste sensivel se 

• A doenga nao puder ser negligenciada. Se a pessoa tiver a doenga, o teste tem alta 
probabilidade de mostrar que a pessoa e doente. 

• For necessario detectar pessoas doentes na populagao. 


Exemplo 8.2 

Um teste diagnostico foi feito em 1.200 participantes de pesquisa: 500 casos (tinham a doenga para a qual o teste foi proposto) e 
700 controles (nao tinham a doenga). Os resultados do teste foram positivos em 320 casos e negativos em 630 controles. 

Resultados do teste diagnostico 


Resultado 

Sim 

Doenga 

Nao 

Total 

Positivo 

320 


70 

390 

Negativo 

180 


630 

810 

Total 

500 


700 

1.200 


320 

5 " 500 * 

0,64 




630 

E ~ 700 ' 

0,90 




O teste e especifico, porque a probabilidade de dar resultado negativo em pessoas que nao tem a doenga e alta (acertou 
em 90% dos controles). No entanto, o teste nao e sensivel, porque a probabilidade de dar resultado positivo em pessoas que tem a 
doenga e baixa (acertou em 64% dos casos). 


Qual e o problema com os testes especificos? A probabilidade de ocorrerem falsos- 
negativos e alta. No Exemplo 8.2, a probabilidade estimada de falsos-negativos e 


180 

5^ =0 ’ 36 


Escolha um teste especifico se 

• O diagnostico da doenga for traumatico. Para a pessoa que nao tem a doenga, o teste indica 



isso com alta probabilidade. 

• Para fechar um diagnostico. Se o resultado for negativo, a pessoa muito provavelmente nao 
tem a doenga. 

Acuracia (A) e a proporgao dos resultados corretos (tanto positivos como negativos) na 
amostra. 


VP + VN 

A =- 

n 

A acuracia nao e adequada para julgar um teste diagnostico. Isso porque um valor alto de 
acuracia nao diz se o teste tem maior probabilidade de detectar verdadeiros-positivos ou de 
detectar verdadeiros-negativos. 

As definigoes de sensibilidade e especificidade tambem se aplicam aos sintomas e sinais. 
Assim: 

• Se o sintoma ou sinal e altamente sensivel, aparece em quase todos os doentes. 

• Se o sintoma ou sinal e altamente espetifico, a ausencia dele praticamente exclui a 
possibilidade de o indivrduo ter a doenga. 

8.1.1. Cuidados no levantamento de dados para o estudo de testes diagnostics 

Classificagao de presenga ou ausencia da doenga: deve ser feita usando como referenda um 
“padrao-ouro” ( gold standard ) e deve ser confirmada por diferentes clinicos. O resultado dessa 
classificagao nao deve ser conhecido pelos pesquisadores que avaliam o teste. 

Selegao dos participantes da pesquisa: devem ser incluidas pessoas saudaveis e pessoas com a 
doenga que se pretende diagnosticar, mas nao devem ser inclurdos apenas os doentes em estado 
muito grave. 

8.1.2. Valores preditivos 

Na pratica clinica, o que importa e o diagnostico correto. Isso significa ter um teste com alta 
probabilidade de dar resultado positivo para o portador da doenga e alta probabilidade de dar 
negativo para quern nao tem a doenga. Em outras palavras, o que interessa e saber a 
probabilidade de o paciente ter a doenga, dado que o teste resultou positivo, e a probabilidade de 
o paciente nao ter a doenga, dado que o teste resultou negativo. Observe a Figura 8.2. 



Verdadeiro-positivo 


Teste 



Falso-positivo 


Verdadeiro-negativo 


Falso-negativo 


Prevalencia 

Figura 8.2 - Teste diagnostico. 


Veja, entao, as definigoes: 

Valor preditivo de um teste positivo (VPP): e a proporgao de resultados positivos corretos no 
total de resultados positivos. 


VPP 


VP 

VP + FP 


Valor preditivo de um teste negativo (VPN): e a proporgao de resultados negativos corretos no 
total de resultados negativos. 


VPN = 


VN 

FN + VN 


Exemplo 8.3 

Reveja o Exemplo 8.1: um teste diagnostico para detectar determinada doen^a foi aplicado em 1.000 participantes de pesquisa: 
400 tinham a doen^a e 600 nao tinham a doen^a. Os resultados do teste foram positivos em 380 dos casos e negativos em 360 dos 
controles. 


Resultados do teste diagnostico 


Resultado 

Sim 

Doen^a 

Nao 

Total 

Positivo 

380 


240 

620 

Negativo 

20 


360 

380 

Total 

400 


600 

1.000 


VPP = 


380 

380 + 240 


0,613 


VPN = 


360 

20 + 360 


0,947 



















Valores preditivos sao muito uteis para os clmicos, mas tem a desvantagem de depender da 
prevalencia da doenqa . 103 

Prevalencia e a proporqao de pessoas com a doenqa na populaqao. Veja, com base em 
exemplos , 104 como os valores preditivos mudam quando mudam as prevalencias. 

As Tabelas 8.2 e 8.3 apresentam dados fictrcios de amostras com n = 344 individuos. A 
sensibilidade e a especificidade dos testes foram mantidas iguais. 

Na Tabela 8.2 estao os dados obtidos de uma populaqao em que a prevalencia da doenqa e 
75%. Entao, espera-se que, na amostra, 0,75 x 344 = 258 indivrduos tenham a doenqa. 

Na Tabela 8.3 estao os dados obtidos de uma populaqao em que a prevalencia da doenqa e 
25%. Entao, espera-se que, na amostra, 0,25 x 344 = 86 indivrduos tenham a doenqa. Veja como 
mudam os valores preditivos quando se mudam as prevalencias. 


Tabela 8.2 - Relagao entre a presenga ou nao da doenga e 0 resultado do teste (Prevalencia = 0,75) 


Resultado do teste 


Doen^a 


Total 


Presente 


Ausente 


Positivo 

231 


32 

263 

Negativo 

27 


54 

81 

Total 

258 


86 

344 

Tabela 8.3 - Relagao entre a presenga ou nao da doenga e 

0 resultado do teste (Prevalencia = 0,25) 


Resultado do teste 


Doen^a 


Total 


Presente 


Ausente 


Positivo 

77 


96 

173 

Negativo 

9 


162 

171 

Total 

86 


258 

344 


Tabela 8.4 - Analise das propriedades dos exames para diagnostico apresentados nas Tabelas 8.2 e 8.3 


Propriedades 


Prevalencia 


0,75 

0,25 

Sensibilidade 

0,895 

0,895 

Especificidade 

0,628 

0,628 

Valor preditivo do teste positivo 

0,878 

0,445 

Valor preditivo do teste negativo 

0,667 

0,947 


8.1.3. Razao de verossimilhangas 

Alem das maneiras ja descritas, ha outra forma de avaliar 0 desempenho de um teste diagnostico. 
E pela razao de verossimilhangas, que significa razao entre duas probabilidades. 


Razao de verossimilhangas e a razao entre a probabilidade de resultados positivos nas pessoas 
que tern a doenga e a probabilidade de resultados positivos em quern nao tern a doenga. 

VP 

Razao = 

FP 

FP + VN 
Sensibilidade 

Razao = --- , —— 

1 - Especificidade 

A razao de verossimilhanga pode ser vista como indicadora do valor do teste para aumentar a 
certeza sobre diagnostics positivos. Uma razao de verossimilhanga maior que 1 indica que o 
resultado do teste esta associado a presenga da doenga, enquanto uma razao de verossimilhanga 
inferior a 1 indica que o resultado do teste esta associado a ausencia de doenga. 

Para os dados das Tabelas 8.2 e 8.3, a estimativa da razao de verossimilhanga indica que o 
teste esta associado a presenga da doenga, porque e: 

_ Sensibilidade 0,895 ,, 

Razao = -=-=2,41 

1 - Especificidade 1 - 0,628 



8.2. NUMERO NECESSARIO TRATAR (NNT) 

O NNT ou numero necessdrio tratar (number needed to treat ) e o numero de pacientes que 
precisam receber uma intervengao especffica para que mais um deles se beneficie dentro do 
perlodo de tempo estipulado para o ensaio. 

Para calcular o NNT, existe uma formula. 105 Entao, seja p t a proporgao de sucessos no grupo 
tratado ep c a proporgao de sucessos no grupo controle, como mostrado na Tabela 8.5. 


Tabela 8.5 - Propor^oes de sucessos e fracassos nos dois grupos, tratado e controle 


Evento 

Tratado 

Grupo 

Controle 

Sucesso 

Pt 


Pt 

Fracasso 

!-Pt 


1-Pc 

Total 

1 


1 


A formula para calcular o numero necessario tratar e 


1 

NNT = - 

Pt-Pc 


Note que 1- p ( eo risco de fracasso no grupo tratado e 1- p c e o risco de fracasso no grupo 
controle. 


Exemplo 8.4 

Imagine que, para verificar se uma nova intervenqao aumenta a probabilidade de sobrevida decorridos 5 anos apos o diagnostico 
de cancer no pulmao estagio III, foi feito um ensaio clinico randomizado com 450 pacientes: 200 foram designados para o 
controle e 250 para a nova intervengao. Morreram 160 pacientes do grupo controle e 175 pacientes do grupo submetido a nova 
intervengao no periodo de tempo estudado, como mostrado na tabela. 

Proporgao de sobreviventes segundo o grupo 


Evento Grupo 



Tratado 

Controle 

Sucesso 

75 

40 

Fracasso 

175 

160 

Total 

250 

200 

Proporgao 

(sobreviventes) 

75 

P ' = 250 = 0 ' 3 

40 

”' = 200 = 0 ' 2 


1 

NNT = - 

Pt-Pc 


1 

0,3 -0,2 


= 10 





No exemplo, NNT = 10 e o numero de pacientes que precisam ser tratados para que, dentro de 5 anos, ocorra o desfecho desejado 
(sobrevida) em um paciente a mais do que o esperado para o grupo controle. Talvez seja difi'cil entender. Vamos entao construir 
tabelas consecutivamente, mantendo as proporgoes de sobreviventes do Exemplo 8.4, mas simplificando os numeros. 


Proporgao de sobreviventes segundo o grupo (grupos de mesmo tamanho) 


Evento 

Tratado 

Grupo 

Controle 

Sucesso 

60 


40 

Fracasso 

140 


160 

Total 

200 


200 

Proporgao 

(sobreviventes) 

60 

P ' = 200 = 0 ’ 3 


40 

Pt = 200 = 0,3 


Note que todos os numeros na tabela que acabamos de ver sao divisiveis por 20. Vamos, entao, fazer essa simplificagao. 

Proporgao de sobreviventes segundo os grupos (grupos de tamanho 10) 


Evento 

Tratado 

Grupo 

Controle 

Sucesso 

3 


2 

Fracasso 

7 


8 

Total 

10 


10 

Proporgao 

(sobreviventes) 

p * 4= 0,3 


Pt = B = 0,2 


Veja a explicaqao do NNT =10: se forem tratados 10 pacientes, espera-se que sobrevivam 3, 1 
a mais do que os 2 que sobreviveriam no grupo controle. Portanto: 

• NNT = 100 significa que 100 pacientes precisam ser tratados para que mais 1 deles tenha o 
efeito desejado. 

• NNT = 10 significa que 10 pacientes precisam ser tratados para que mais 1 deles tenha o 
efeito desejado. 

• NNT = 1 significa que um paciente precisa ser tratado para que tenha o efeito desejado. 

Entao, fica evidente: quanto menor for o NNT, maior e o beneficio da terapia. NNT =1 e, 
portanto, o ideal, porque significa que todo paciente tratado e beneficiado. 


Exemplo 8.5 

Imagine que 12% das pessoas com determinado diagnostico morrem dentro de 1 ano. Uma nova droga reduziu a mortaiidade para 
8%. Como se calcula o NNT? 





p t = 1 - 0,08 = 0,92 


p c = 1 - 0,12 = 0,88 
1 1 

NNT = -= -= 25 

0,92 - 0,88 0,04 


Em media, 25 pacientes teriam que receber a nova intervengao (em lugar do controle) para que se espere registrar a sobrevivencia 
de 1 paciente a mais. 


O numero necessario tratar e o inverso da redugao absoluta de risco (RAR) (absolute risk 
reduction). E muitas vezes expressa como porcentagem. Veja: 

RAR = taxa do evento no controle - taxa do evento no tratado 


Exemplo 8.6 

Reveja o Exemplo 8.5. A redugao absoluta de risco (RAR) e dada por 


RAR = 12% - 8% = 4% 


A redugao do risco de morte, devido ao tratamento, foi de 12% - 8%= 4%. 

A redugao absoluta de risco e uma forma util de apresentar o resultado da pesquisa, principalmente se o leitor for um tomador de 
decisao. 





8.3. concordAncia entre examinadores 


Nas pesquisas em que e preciso classificar as unidades em varias categorias, podem surgir 
discordancias entre os examinadores sobre algumas classificaqoes. Como saber se os 
examinadores concordam na maior parte das vezes? Vamos discutir o caso mais simples, de dois 
examinadores que classificam as unidades do estudo em varias categorias. 

Veja a Tabela 8.6. Dois examinadores, A e B, classificaram a gravidade da doenqa de n 
pacientes em tres categorias, leve, moderada e severa. As celulas que constituem a diagonal 
principal foram coloridas. Ali estao as concordancias. Somando o valor dessas celulas e 
dividindo pelo total, voce tern a porcentagem de concordancias no total de julgamentos. 


Tabela 8.6 - Gravidade da doenga julgada por dois examinadores em n pacientes 

Examinador A Examinador B 

Leve Moderada Severa Total 

Leve 

Moderada 

Severa 

Total n 


Exemplo 8.7 

Dois radiologistas classificaram 85 mamografias nas seguintes categorias: “Normal”, “Doenga benigna”, “Suspeita de cancer” ou 
“Cancer”. E facil contar, na tabela, o numero de casos em que eles estavam de acordo (em negrito). 

Classificagao das mamografias por dois radiologistas 


Radiologista A Radiologista B Total 



Normal 

Doen^a benigna 


Suspeita de cancer 

Cancer 


Normal 

21 

12 


0 

0 

33 

Doenga benigna 

4 

17 


1 

0 

22 

Suspeita de cancer 

3 

9 


15 

2 

29 

Cancer 

0 

0 


0 

1 

1 

Total 

28 

38 


16 

3 

85 

Uma medida da concordancia e dada por: 








21 + 17 + 15 + 1 

54 

= 0,635 





85 

“ 85 




No Exemplo 8.7, que acabamos de ver, nao foi colocada uma hipotese em teste, nem foi 



medida a associaqao entre as respostas - o que se obteve foi o grau de concordancia dos 
radiologistas - que, no caso, foi estabelecida em 63,5%. Essa estatistica e citada em muitos 
trabalhos. No entanto, e logico esperar que algumas concordancias ocorram por simples acaso - 
o que minimiza a importancia desse resultado. 

Nem todos os estatisticos concordam que se deva procurar outra estatistica para indicar o grau 
de concordancia entre examinadores. No entanto, o fato e que a estatistica kappa, que se 
representa pela letra grega + (que se le “capa”), e bem conhecida e esta em programas de 
computador, o que garante seu uso. 

Vejamos como se calcula esse coeficiente de concordancia. Primeiro, considere: se todos os 
examinadores concordarem com a categorizaqao das unidades, a estatistica que mede 
concordancia deve ter valor 1. Seja I Q a proporqao das concordancias observadas na amostra. 
Como ja calculamos, no caso do Exemplo 8.6: 

, 21 + 17 + 15+1 54 

/„=-=—= 0,635 

0 85 85 


Vamos agora calcular a proporqao de concordancias que seriam obtidas para esse exemplo por 
simples acaso, que indicaremos por I E . Lembre-se do que foi visto no Caprtulo 6 para tabelas de 
contingencia: sob a hipotese de que nao existe associaqao (hipotese da nulidade), a frequencia 
esperada em determinada celula e dada pelo total da coluna (em que a celula esta) multiplicado 
pelo total da linha (em que a celula esta), dividido pelo tamanho da amostra. Calculam-se, 
assim, as frequences esperadas na diagonal principal - ou seja, as frequences esperadas sob a 
hipotese de que as concordancias entre examinadores seriam apenas casuais. 


Radiologista A 

Normal 

Doenga benigna 

Suspeita de cancer 
Cancer 


Normal 


33 x 28 
85 


10,87 


Radiologista B 

Doen^a benigna Suspeita de cancer 


Cancer 


22 x 38 
85 


= 9,84 


29 x 16 


5,46 


1 x 3 
85 


= 0,04 


A proporqao de concordancias que seriam obtidas por simples acaso e dada por: 

10,87 + 9,84 + 5,46 + 0,04 26,2 

-—-— 0,308 

85 85 

No Exemplo 8.7, a proporqao de concordancias observadas na amostra foi de 0,635, que 
indicamos por I Q . A proporqao de concordancias que ocorreriam por acaso e de 0,308, que 



indicamos por I E . Sabemos, ainda, que o maximo possrvel de concordancias e 1,000. O 
coeficiente de concordancia kappa e construido da seguinte forma: 

• A proporqao maxima de concordancias e 1. 

• Descontando, da proporqao maxima, a proporqao que ocorreria por acaso, tem-se 1 - I E . 

• Descontando, da proporqao observada, a proporqao que ocorreria por acaso, tem-se I Q - I E . 

• A estimativa do coeficiente de concordancia + e dada pela proporqao. 



K = 


Exemplo 8.8 


Para os dados do Exemplo 8.7, o coeficiente de concordancia kappa e: 


Se a concordancia entre examinadores for perfeita, o coeficiente de concordancia + tem valor maximo, que e 1. Se nao houver 
concordancia entre os examinadores, o valor de + e zero. No entanto, como interpretar valores entre 0 e 1? Voce pode seguir a 
recomendaqaoda Tabela 8.7. 106 


Tabela 8.7 - Classifica^ao da forqa da concordancia entre examinadores em funqao do valor de kappa 


Valor de ■+■ 


I nna da concordancia 


Menor do que 0,21 


Pobre 


0,21 y 0,41 


Regular 


0,411- 0,61 


Moderada 


0,61 h 0,81 


Boa 


0,81 h 1,00 


Muito boa 


Os programas para computador calculam o valor de kappa e dao o intervalo de confianqa. A formula e complicada, mas voce a 
encontra em livros de estatfstica mais avan^ados! 07 





8.4. ALFA DE CRONBACH 


A confiabilidade de um instrumento de medida tern diferentes aspectos. Existem, pois, diferentes 
estatzsticas para estimar confiabilidade, cada qual avaliando um aspecto da conformidade do 
instrumento. Podem ser avaliadas: 

• A confiabilidade entre examinadores, ou seja, o grau com que diferentes examinadores 
veem o mesmo fenomeno, usando o mesmo instrumento. 

• A confiabilidade do teste-reteste, isto e, a consistencia das medidas feitas com o mesmo 
instrumento de medida em ocasioes diferentes. 

• A confiabilidade de forma paralela, que e a consistencia dos resultados de dois instrumentos 
diferentes, mas construidos da mesma maneira. 

Todas essas caracterzsticas dos sistemas de mediqao sao estudadas em estatrstica para 
qualidade. Os nomes usados em engenharia sao diferentes, mas, basicamente, os conceitos sao os 
mesmos. Nas areas de ciencias sociais, em que sao feitos testes e questionarios, tambem se 
define: 

• Consistencia interna de um teste ou um questionario e a extensao em que os itens que o 
compoem medem o mesmo conceito ou construto. Por exemplo, se 10 questoes foram 
projetadas para medir o mesmo construto, o respondente deveria ter coerencia nas respostas. 
A consistencia interna e, portanto, uma das quatro classes de estimativas de confiabilidade, 
sendo especrfica para testes e questionarios. 

Para medir a consistencia de um questionario, a estatrstica mais usada e o coeficiente alfa. E 
facil calcular esse coeficiente e essa estatrstica ainda tern a vantagem de poder ser calculada 
mesmo quando o questionario e aplicado uma unica vez. No entanto, o coeficiente alfa nem 
sempre e bem interpretado. 

Vamos lembrar um pouco do vocabulario da area. Todo questionario e constiturdo por varias 
perguntas, que aqui serao chamadas de itens. Depois de pronto, o questionario deve ser entregue 
para um grupo de pessoas selecionadas de acordo com determinado criterio, para que o 
respondam e devolvam ao pesquisador. 

As opqoes de resposta para cada item podem ser dicotomicas, como “Sim” e “Nao”, ou 
escalonadas, como “Concordo plenamente”, “Concordo”, “Nao concordo nem discordo”, 
“Discordo”, “Discordo completamente”. De qualquer forma, para o calculo do coeficiente alfa, 
toda resposta deve ser transformada em postos. 

Seja x- o z-esimo posto do j-e simo respondente, z = 1, 2 e j = 1, 2,...,n. Considere um 
questionario com k itens, respondido por n pessoas. Para calcular o coeficiente alfa de Cronbach, 
aplica-se a formula: 


( 


k 

or =- 

k-l 


\ 


c 2 

^ soma 

) 



k e o numero de itens, n e o numero de respondentes. 
s 2 i e a variancia dos n escores das pessoas a z-esimo item (i = 1 ,..., k), 
s 2 S0ma e a variancia dos totais Tj (j = 1, 2de escores de cada respondente. 
As variancias sao calculadas pela formula: 

o2 = I(x-x ) 2 
n 


Exemplo 8.9 

E dado um exemplo ficticio de resultados de um questionario. Eram k = 5 perguntas, que so podiam ser respondidas como “Sim” 
ou “Nao”. As respostas configuram uma variavel dicotomica que precisa ser transformada em numero. Entao “Sim” ficou sendo 
1 e “Nao” ficou sendo zero. Responderam o questionario n = 10 pessoas. 


Resultados da aplicagao de um questionario com 5 itens e 10 respondentes 


Respondente 

12 

22 

Item 

32 

42 

52 

Total de escores de cada respondente (T) 

1 

1 

1 

1 

1 

1 

5 

2 

1 

1 

1 

1 

0 

4 

3 

1 

1 

1 

0 

1 

4 

4 

1 

1 

0 

1 

0 

3 

5 

1 

1 

1 

0 

0 

3 

6 

1 

1 

0 

0 

1 

3 

7 

1 

1 

0 

0 

0 

2 

8 

0 

1 

1 

0 

0 

2 

9 

1 

0 

1 

0 

0 

2 

10 

1 

0 

0 

0 

0 

1 

e escores de cada item 

9 

8 

6 

3 

3 

29 


Para obter alfa, e preciso calcular as variancias que estao apresentadas no rodape da tabela. 


Variancias usadas na formula de alfa 


Respondente 

12 

22 

Item 

3° 

4° 

5“ 

Total de escores de cada respondente (T) 

1 

1 

1 

1 

1 

1 

5 

2 

1 

1 

1 

1 

0 

4 








3 

4 

5 

6 

7 

8 

9 

10 

Variancia 


1 

1 

1 

1 

1 

0 

1 

1 

0,1000 


1 

1 

1 

1 

1 

1 

0 

0 

0,1778 


1 

0 

1 

0 

0 

1 

1 

0 

0,2667 


0 

1 

0 

0 

0 

0 

0 

0 

0,2333 


1 

0 

0 

1 

0 

0 

0 

0 

0,2333 


4 

3 

3 

3 

2 

2 

2 

1 

1,4333 


Numero de itens = 5 
Soma das variancias dos itens 


0,1000 + 0,1778 + 0,2667 + 0,2333 + 0,2333 = 1,0111 


Variancia dos totais dos escores de cada respondente =1,4333 


a = 


5-1 


1 - 


0,1000 + 0,1778 + 0,2667 + 0,2333 


1,4333 


= 0,36 


A interpretaqao do coeficiente alfa de Cronbach e aparentemente intuitiva porque, na maior 
parte das vezes, os valores variam entre 0 e 1. Entende-se, entao, que a consistencia interna de 
um questionario e tanto maior quanto mais perto de 1 estiver o valor da estatistica. Ha muita 
discussao sobre os valores aceitaveis de alfa: em geral, variam entre 0,70 e 0,95. 

A maneira pratica de julgar o valor de alfa e comparar o valor calculado com o valor 
preconizado por diferentes autores em tabelas apresentadas na literatura. A regra e imprecisa, 
mas serve como primeira aproximaqao, desde que se tenha a precauqao de levar em conta as 
limitaqoes dessa estatistica. Veja as Tabelas 8.8. e 8.9. 


Tabela 8.8 - Consistencia interna do questionario 


Valor de alfa 

Maior que 0,80 
De 0,80 a 0,61 
De 0,60 a 0,41 
De 0,41 a 0,21 
Menor que 0,21 


Consistencia interna 

Quase perfeita 
Substancial 
Moderada 
Razoavel 
Pequena 


Fonte: Landis, J. R.; Kock, G.G. The measurement of observer agreement for categorical data. Biometrics 33:159, 1977. 


Tabela 8.9 - Consistencia interna do questionario 






Valor de alfa 

Consistencia interna 

0,91 ou mais 

Excelente 

0,90 h 0,81 

Bom 

0,81 h 0,71 

Aceitavel 

0,71 h 0,61 

Questionavel 

0,61 h 0,51 

Pobre 

Menor que 0,51 

Inaceitavel 


Fonte: GEORGE, D.; MALLERY, P. SPSS for Windows step by step: a simple guide and referenced ed. Boston: Alley & Bacon, 2003. Apud 
GLIEM, J.A.; GLIEM, R.R. Calculating, interpreting and reporting Cronbach’s alpha reliability for Likert-type scales. Disponivel em: htpps: 
//scholarworks.iupui.edu/bitstream/handle. Acesso em outubro de 2013. 


E importante saber, ao julgar o valor calculado de alfa, que: 

• O numero de questoes afeta o valor de alfa. Questionarios muito longos aumentam o valor 
de alfa, sem que isso signifique aumento de consistencia interna; um valor baixo de alfa 
pode significar apenas um numero pequeno de questoes. 

• A redundancia, isto e, questoes verbalizadas de forma diferente, mas praticamente iguais, 
aumentam o valor de alfa. 

• Correlagdes entre os itens do questionario aumentam o valor de alfa. Se varios itens do 
questionario exibem correlates entre si, o valor de alfa aumenta. Como essas correlates 
sao maiores quando os itens do questionario medem o mesmo construto, o pesquisador 
conclui que o questionario tern consistencia interna, ou seja, o valor alto do coeficiente alfa 
de Cronbach estaria indicando o grau em que os itens medem o mesmo construto. No 
entanto, e preciso cuidado: pode haver uma terceira variavel afetando as respostas de dois 
itens. Uma boa discussao ajuda muito. 

Para o exemplo dado, o valor do coeficiente alfa de Cronbach e a = 0,36. Se os dados fossem 
reais (e nao criados apenas para mostrar como se fazem os calculos), o valor de alfa poderia ser 
explicado pelo numero pequeno de perguntas e de respondentes, mas tambem poderia indicar 
que os itens (perguntas) do questionario nao estavam medindo o mesmo construto ou a mesma 
dimensao (unidimensional). 

O coeficiente alfa de Cronbach pode ser calculado a partir de programas estatrsticos como 
SPSS ( Statistical Software for Social Sciences ) ou SAS ( Statistical Analysis System ). Esses 
programas fornecem analise descritiva inicial completa das respostas obtidas do questionario, 
bem como listagem completa da analise da confiabilidade. O coeficiente alfa de Cronbach pode 
ser calculado por outros programas. 



RESUMO E OBJETIVO DO CAPITULO 


Depois de estudar este Capitulo, voce devera ser capaz de calcular e interpretar as seguintes 
estatrsticas: 

• Sensibilidade e especificidade nos testes diagnosticos. 

• Valores preditivos nos testes diagnosticos. 

• Razao de verossimilhangas nos testes diagnosticos. 

• Numero necessario tratar. 

• Coeficiente de concordance. 

• Alfa de Cronbach. 


103 Teorema de Bayes: The Harvard School Test. Dispom'vel em: soniavieira.blogspot.com/2015/09/teorema-de-bayes-iii-harvard- 
medical.html. Acesso em 18 de novembro de 2017. 

104 ALTMAN, D.O. Practical Statistics for Medical Research. 2 nd ed. London: Chapman & Hall, 1993. p. 410-413. 

105 Number Needed to Treat (NNT) Calculator - ClinCalc. Disponivel em: clincalc.com/Stats/NNT.aspx 

106 ALTMAN, D.O. Practical Statistics for Medical Research. 2 nd ed. London: Chapman & Hall, 1993. p. 404. 

107 FLEISS, J.L. Statistical methods for rates and proportions. 2 nd ed. New York: Wiley, 1981. p. 219-220. 




B.a.i. nesquisauores anansaram o rator reumaioiae (nil no soro ae i/o pacientes com artrite reumaioiae e z/4 sem a aoenga. us 
dados estao apresentados na Tabela 8.10. Calcule a sensibilidade (S), a especificidade ( E ) e a acuracia (A) do teste. 

Tabela 8.10 - Exame para fator reumatoide (FR) no soro de pacientes com e sem artrite reumatoide 


Resultado do exame 


Doenga 



Presente 


Ausente 

Positivo 

120 


24 

Negativo 

56 


250 


Fonte: MEDEIROS, M.M.C.; FERRAZ, M.B. Estudos sobre diagnosticos. Rev Bras Reumatol 38(4): 239-375, 1998. 


8.5.2. Com os dados da Tabela 8.10, calcule o valor preditivo de teste positivo (VPP) e o valor preditivo de teste negativo (VPN). 

8.5.3. Um ensaio randomizado placebo-controlado foi conduzido com participantes com hipertensao leve. Entre 100 alocados 

para tratamento ativo, houve 1 acidente vascular cerebral. Entre 100 alocados ao placebo, houve 2 acidentes vasculares 
cerebrals. Qual e o mirnero necessario tratar ( NNT) para evitar um unico acidente vascular cerebral sob as condigoes deste 
teste? 

8.5.4. Obtenha a sensibilidade, a especificidade, os valores preditivos e a precisao do exame fisico prostatico (EFP) no 

diagnostico do adenocarcinoma de prostata (ACP). Foram levantados os dados apresentados na Tabela 8.11. Nota: a 
biopsia da a situagao verdadeira. 

Tabela 8.11 - Distribuigao dos pacientes segundo os achados no exame fisico prostatico e na biopsia 


Exame fisico prostatico 

Positiva 

Biopsia 

Negativa 

Positivo 

30 


28 

Negativo 

31 


108 


Fonte: ANTOPOULOS, I.M. et al. Results of prostate cancer screening in no-symptomatic men. Disponivel em: 
http://braziurol.com.br2001/Antonopoulos 227 234.htm 


8.5.5. Para estudar a sensibilidade, a especificidade, os valores preditivos e a precisao da dosagem de antigeno prostatico 
especifico (PSA) total (valor alto aponta presenga da doenga) no diagnostico do adenocarcinoma de prostata (ACP), 
foram levantados os dados apresentados na Tabela 8.12. Faga os calculos. Nota: Biopsia indica a verdade, PSA total < 4 
ng/mL indica resultado negativo e PSA total > 4 ng/mL indica resultado positivo. 


Tabela 8.12 - Distribuigao dos pacientes segundo o PSA total e a biopsia 


PSA total 


Biopsia 


Positiva Negativa 

Menor do que 4 ng/mL 10 48 

Igual ou maior do que 4 ng/mL 15 124 

Fonte: ANTOPOULOS, I.M. et al. Results of prostate cancer screening in no-symptomatic men. Disponivel em : http://braziurol.com.br 
2001/Antonopoulos 227 234.htm 


8.5.6. Pesquisadores analisaram as caracteristicas do anticorpo antiestrato corneo (AEC) no soro de 176 pacientes com artrite 
reumatoide e 274 sem a doenga. Os dados apresentados na Tabela 8.13 permitem calcular a razao de verossimilhangas. 


Compare o resultado obtido com o resultado do Exemplo 8.7. 


Tabela 8.13 - Caracterfsticas do anticorpo antiestrato corneo (AEC) no soro de pacientes com e sem artrite reumatoide 


Resultado do exame 

Presente 

Doenga 

Ausente 

Total 

Positivo 

71 


4 

75 

Negativo 

105 


270 

375 

Total 

176 


274 

450 


Fonte: MEDEIROS, M.M.C.; FERRAZ, M.B. Estudos sobre diagnosticos. Rev Bras Reumatol 38(4): 239-375, 1998. 

8.5.7. Um teste 108 tern sensibilidade de 99% e especificidade de 92%. Calcule o valor preditivo, tanto positivo como negativo, 

em uma populagao em que a prevalencia da doenga e de 5%. 

8.5.8. Dois professores de um curso de pos-graduagao avaliaram 20 alunos. Os criterios de avaliagao eram A, B, C e D. Os 

criterios atribui'dos estao na Tabela 8.14. Calcule kappa e interprete o resultado. 

Tabela 8.14 - Conceitos atribui'dos a 20 alunos por dois professores 

N2 do aluno Professor 

1 2 


1 

A 

B 

2 

A 

A 

3 

A 

A 

4 

A 

A 

5 

A 

B 

6 

A 

B 

7 

A 

B 

8 

B 

C 

9 

A 

B 

10 

B 

A 

11 

A 

A 

12 

A 

A 

13 

A 

A 

14 

A 

A 

15 

A 

A 

16 

B 

C 

17 

B 

C 

18 

B 

B 

19 

A 

B 

20 

B 

A 


8.5.9. Quando o valor de kappa e igual a 1? 


8.5.10. Quando a sensibilidade e a especificidade de um exame para diagnostics sao iguais a 1? 


108 MOTULSKY, H. Intuitive Biostatistics. New York: Oxford University Press, 1995. p.139. 




Apendice 









Tabela 1. Distribuigao normal reduzida P(0 < Z < z) 


Ultimo digito 



0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

0,0 

0,0000 

0,0040 

0,0080 

0,0120 

0,0160 

0,0199 

0,0239 

0,0279 

0,0319 

0,0359 

0,1 

0,0398 

0,0438 

0,0478 

0,0517 

0,0557 

0,0596 

0,0636 

0,0675 

0,0714 

0,0753 

0,2 

0,0793 

0,0832 

0,0871 

0,0910 

0,0948 

0,0987 

0,1026 

0,1064 

0,1103 

0,1141 

0,3 

0,1179 

0,1217 

0,1255 

0,1293 

0,1331 

0,1368 

0,1406 

0,1443 

0,1480 

0,1517 

0,4 

0,1554 

0,1591 

0,1628 

0,1664 

0,1700 

0,1736 

0,1772 

0,1808 

0,1844 

0,1879 

0,5 

0,1915 

0,1950 

0,1985 

0,2019 

0,2054 

0,2088 

0,2123 

0,2157 

0,2190 

0,2224 

0,6 

0,2257 

0,2291 

0,2324 

0,2357 

0,2389 

0,2422 

0,2454 

0,2486 

0,2517 

0,2549 

0,7 

0,2580 

0,2611 

0,2642 

0,2673 

0,2703 

0,2734 

0,2764 

0,2794 

0,2823 

0,2852 

0,8 

0,2881 

0,2910 

0,2939 

0,2967 

0,2995 

0,3023 

0,3051 

0,3078 

0,3106 

0,3133 

0,9 

0,3159 

0,3186 

0,3212 

0,3238 

0,3264 

0,3289 

0,3315 

0,3340 

0,3365 

0,3389 

1,0 

0,3413 

0,3438 

0,3461 

0,3485 

0,3508 

0,3531 

0,3554 

0,3577 

0,3599 

0,3621 

1,1 

0,3643 

0,3665 

0,3686 

0,3708 

0,3729 

0,3749 

0,3770 

0,3790 

0,3810 

0,3830 

1,2 

0,3849 

0,3869 

0,3888 

0,3907 

0,3925 

0,3944 

0,3962 

0,3980 

0,3997 

0,4015 

1,3 

0,4032 

0,4049 

0,4066 

0,4082 

0,4099 

0,4115 

0,4131 

0,4147 

0,4162 

0,4177 

1,4 

0,4192 

0,4207 

0,4222 

0,4236 

0,4251 

0,4265 

0,4279 

0,4292 

0,4306 

0,4319 

1,5 

0,4332 

0,4345 

0,4357 

0,4370 

0,4382 

0,4394 

0,4406 

0,4418 

0,4429 

0,4441 

1,6 

0,4452 

0,4463 

0,4474 

0,4484 

0,4495 

0,4505 

0,4515 

0,4525 

0,4535 

0,4545 

1,7 

0,4554 

0,4564 

0,4573 

0,4582 

0,4591 

0,4599 

0,4608 

0,4616 

0,4625 

0,4633 

1,8 

0,4641 

0,4649 

0,4658 

0,4664 

0,4671 

0,4678 

0,4686 

0,4693 

0,4699 

0,4706 

1,9 

0,4713 

0,4719 

0,4726 

0,4732 

0,4738 

0,4744 

0,4750 

0,4756 

0,4761 

0,4767 

2,0 

0,4772 

0,4778 

0,4783 

0,4788 

0,4793 

0,4798 

0,4803 

0,4808 

0,4812 

0,4817 

2,1 

0,4821 

0,4826 

0,4830 

0,4834 

0,4838 

0,4842 

0,4846 

0,4850 

0,4854 

0,4857 

2,2 

0,4861 

0,4864 

0,4868 

0,4871 

0,4875 

0,4878 

0,4881 

0,4884 

0,4887 

0,4890 

2,3 

0,4893 

0,4896 

0,4898 

0,4901 

0,4904 

0,4906 

0,4909 

0,4911 

0,4913 

0,4916 

2,4 

0,4918 

0,4920 

0,4922 

0,4925 

0,4927 

0,4929 

0,4931 

0,4932 

0,4934 

0,4936 

2,5 

0,4938 

0,4940 

0,4941 

0,4943 

0,4945 

0,4946 

0,4948 

0,4949 

0,4951 

0,4952 

2,6 

0,4953 

0,4955 

0,4956 

0,4957 

0,4959 

0,4960 

0,4961 

0,4962 

0,4963 

0,4964 

2,7 

0,4965 

0,4966 

0,4967 

0,4968 

0,4969 

0,4970 

0,4971 

0,4972 

0,4973 

0,4974 

2,8 

0,4974 

0,4975 

0,4976 

0,4977 

0,4977 

0,4978 

0,4979 

0,4979 

0,4980 

0,4981 

2,9 

0,4981 

0,4982 

0,4982 

0,4983 

0,4984 

0,4984 

0,4985 

0,4985 

0,4986 

0,4986 

3,0 

0,4987 

0,4987 

0,4987 

0,4988 

0,4988 

0,4989 

0,4989 

0,4989 

0,4990 

0,4990 


Fonte: FREUND, J.E.; SMITH, R.N. Statistic: A First Course. Englewood Cliffs, Prentice Hall. p. 507,1986. 
















Tabela 2. Valores de % 2 , segundo os graus de liberdade e o valor de ~ 


Graus de liberdade 


Valor de a 



10% 

5% 

1% 

1 

2,71 

3,84 

6,64 

2 

4,60 

5,99 

9,21 

3 

6,25 

7,82 

11,34 

4 

7,78 

9,49 

13,28 

5 

9,24 

11,07 

15,09 

6 

10,64 

12,59 

16,81 

7 

12,02 

14,07 

18,48 

8 

13,36 

15,51 

20,09 

9 

14,68 

16,92 

21,67 

10 

15,99 

18,31 

23,21 

11 

17,28 

19,68 

24,72 

12 

18,55 

21,03 

26,22 

13 

19,81 

22,36 

27,69 

14 

21,06 

23,68 

29,14 

15 

22,31 

25,00 

30,58 

16 

23,54 

26,30 

32,00 

17 

24,77 

27,59 

33,41 

18 

25,99 

28,87 

34,80 

19 

27,20 

30,14 

36,19 

20 

28,41 

31,41 

37,57 

21 

29,62 

32,67 

38,93 

22 

30,81 

33,92 

40,29 

23 

32,01 

35,17 

41,64 

24 

33,20 

36,42 

42,98 

25 

34,38 

37,65 

44,31 

26 

35,56 

38,88 

45,64 

27 

36,74 

40,11 

46,96 

28 

37,92 

41,34 

48,28 

29 

39,09 

42,56 

49,59 

30 

40,26 

43,77 

50,89 


Fonte: SNEDECOR, G.W.; COCHRAN, W.G. Statistical Methods. Ames, The Jowa State University Press, p. 550-1, 1972. 


Tabela 3. Valores crfticos para 2]% no teste de Mann-Whitney 


Aten^ao: No cabegalho estao os valores de« para um teste unilateral. Se o teste for 
bilateral, leia os valores que tern, no cabe<;alho, o valor u/2. Por exemplo, se« = 0,05, 
procure o valor na coluna de a = 0,025. 




n, = 3 





", = 4 



n 2 

0,005 


0,025 

0,05 

n 2 

0,005 

0,01 

0,025 

0,05 

3 




6-15 

4 



10-26 

11-25 

4 




6-18 

5 


10-30 

11-29 

12-28 

5 



6-21 

7-20 

6 

10-34 

11-33 

12-32 

13-31 

6 



7-23 

8-22 

7 

10-38 

11-37 

13-35 

14-34 

7 



7-26 

8-25 

8 

11-41 

12-40 

14-48 

15-37 

8 



8-28 

9-27 

9 

11-45 

13-43 

14-42 

16-40 

9 

6-33 


8-31 

10-29 

10 

12-48 

13-47 

15-45 

17-43 

10 

6-36 


9-33 

10-32 

11 

12-52 

14-50 

16-48 

18-46 

11 

6-39 


9-36 

11-34 

12 

13-55 

15-53 

17-51 

19-49 

12 

7-41 


10-38 

11-37 

13 

13-59 

15-57 

18-54 

20-52 

13 

7-44 


10-41 

12-39 

14 

14-62 

16-60 

19-57 

21-55 

14 

7-47 


11-43 

13-41 

15 

15-65 

17-63 

20-60 

22-58 

15 

8-49 


11-46 

13-44 








n , = 5 





n, = 6 



n 2 

0,005 

0,01 

0,025 

0,05 

n 2 

0,005 

0,01 

0,025 

0,05 

5 

15-40 

16-39 

17-38 

19-36 

6 

23-55 

24-54 

26-52 

28-50 

6 

16-44 

17-43 

18-42 

20-40 

7 

24-60 

25-59 

27-57 

29-55 

7 

16-49 

18-47 

20-45 

21-44 

8 

25-65 

27-63 

29-61 

31-59 

8 

17-53 

19-51 

21-49 

23-47 

9 

26-70 

28-68 

31-65 

33-63 

9 

18-57 

20-55 

22-53 

24-51 

10 

27-75 

29-73 

32-70 

35-67 

10 

19-61 

21-59 

23-57 

26-54 

11 

28-80 

30-78 

34-74 

37-71 

11 

20-65 

22-63 

24-61 

27-58 

12 

30-84 

32-82 

35-79 

38-76 

12 

21-69 

23-67 

26-64 

28-62 

13 

31-89 

33-87 

37-83 

40-80 

13 

22-73 

24-71 

27-68 

30-65 

14 

32-94 

34-92 

38-88 

42-84 

14 

22-78 

25-75 

28-72 

31-69 

15 

33-99 

36-96 

40-92 

44-88 

15 

23-82 

26-79 

29-76 

33-72 







Continua 































Tabela 3. Continuagao 




n, = 7 





00 

n 

ef 



n 2 

0,005 

0,01 

0,025 

0,05 

n 2 

0,005 

0,01 

0,025 

0,05 

7 

32-73 

34-71 

36-69 

39-66 

8 

43-93 

45-91 

49-87 

51-85 

8 

34-78 

35-77 

38-74 

41-71 

9 

45-99 

47-97 

51-93 

54-90 

9 

35-84 

37-82 

40-79 

43-76 

10 

47-105 

49-103 

53-99 

56-96 

10 

37-89 

39-87 

42-84 

45-81 

11 

49-111 

51-109 

55-105 

59-101 

11 

38-95 

40-93 

44-89 

47-86 

12 

51-117 

53-115 

58-110 

62-106 

12 

40-100 

42-98 

46-94 

49-91 

13 

53-123 

56-120 

60-116 

64-112 

13 

41-106 

44-103 

48-99 

52-95 

14 

54-130 

58-126 

62-122 

67-117 

14 

43-111 

45-109 

50-104 

54-100 

15 

56-136 

60-132 

65-127 

69-123 

15 

44-117 

47-114 

52-109 

56-105 








n, = 9 





n , = 10 


n 2 

0,005 

0,01 

0,025 

0,05 

n 2 

0,005 

0,01 

0,025 

0,05 

9 

56-115 

59-112 

62-109 

66-105 

10 

71-139 

74-136 

78-132 

82-128 

10 

58-122 

61-119 

65-115 

69-111 

11 

73-147 

77-143 

81-139 

86-134 

11 

61-128 

63-126 

68-121 

72-117 

12 

76-154 

79-151 

84-146 

89-141 

12 

63-135 

66-132 

71-127 

75-123 

13 

79-161 

82-158 

88-152 

92-148 

13 

65-142 

68-139 

73-134 

78-129 

14 

81-169 

85-165 

91-159 

96-154 

14 

67-149 

71-145 

76-140 

81-135 

15 

84-176 

88-172 

94-166 

99-161 

15 

69-156 

73-152 

79-146 

84-141 
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Tabcla 3. Continuagao 




n, = 11 




n, = 12 


n 2 

0,005 

0,01 

0,025 

0,05 

n 2 

0,005 

0,01 

0,025 

0,05 

11 

87-166 

91-162 

96-157 

100-153 

12 

105-195 

109-191 

115-185 

120-180 

12 

90-174 

94-170 

99-165 

104-160 

13 

109-203 

113-199 

119-193 

125-187 

13 

93-182 

97-178 

103- 
172 

108-167 

14 

112-212 

116-208 

123-201 

129-195 

14 

96-190 

1 GO- 

186 

106- 

ISO 

112-174 

15 

115-221 

120-216 

127-209 

133-203 

15 

99-198 

103- 

194 

HO- 

187 

116-181 








J3 

II 

—k 

Ul 




n, = 14 


n 2 

0,005 

0,01 

0,025 

0,05 

n 2 

0,005 

0,01 

0,025 

0,05 

13 

125- 

226 

ISO- 

221 

136- 

215 

142-209 

14 

147-259 

152-254 

160-246 

166-240 

14 

129- 

235 

134- 

230 

MI- 

223 

147-217 

15 

151-269 

156-264 

164-256 

171-249 

15 

133- 

244 

138- 

239 

MS- 

232 

152-225 








n, = 15 







n 2 

0,005 

0,01 

0,025 

0,05 






15 

171- 

294 

176- 

289 

184- 

281 

192-273 







Fonte: MINIUM, E.W.; CLARKE, R.C.; GOLADARCI.T. Elements of Statistical Reasoning. New York: Wiley, 1999. p.474-475. 







































Tabela 4. Valores crfticos para T no teste de Wilcoxon 


Nivel de significancia para teste unilateral 
N 0,025 0,01 

Nivel de significancia para teste bilateral 

0,05 0,02 

6 0 

7 2 0 

8 4 2 

9 6 3 

10 8 5 

11 11 7 

12 14 10 

13 17 13 

14 21 16 

15 25 20 

16 30 24 

17 35 28 

18 40 33 

19 46 38 

20 52 43 

21 59 49 

22 66 56 

23 73 62 

24 81 69 

25 89 77 

Fonte: SIEGEL, S. Nonparametric Statistics. New York: McGraw-Hill, 1959. p. 280-281. 


Tabela 5. Valores criticos para H no teste de Kruskal-Wallis 


Tamanho da amostra 



Tamanho da amostra 



", 

n 2 

n s 

H 

P 

n , 

n 2 

"3 

H 

P 


2 

1 

1 

2,7000 

0,500 

4 

3 

2 

6,4444 

0,008 

2 

2 

1 

3,6000 

0,200 




6,3000 

0,011 









5,4444 

0,046 

2 

2 

2 

4,5714 

0,067 




5,4000 

0,051 




3,7143 

0,200 




4,5111 

0,098 









4,4444 

0,102 

3 

1 

1 

3,2000 

0,300 











4 

3 

3 

6,7455 

0,010 









6,7091 

0,013 

3 

2 

1 

4,2857 

0,100 




5,7909 

0,046 




3,8571 

0,133 




5,7273 

0,050 




5,3572 

0,029 




4,7091 

0,092 




4,7143 

0,048 




4,7000 

0,101 




4,5000 

0,067 









4,4643 

0,105 

4 

4 

1 

6,6667 

0,010 









6,1667 

0,022 

3 

3 

1 

5,1429 

0,043 




4,9667 

0,048 




4,5714 

0,100 




4,8667 

0,054 




4,0000 

0,129 




4,1667 

0,082 









4,0667 

0,102 

3 

3 

2 

6,2500 

0,011 









5,3611 

0,032 

4 

4 

2 

7,0364 

0,006 




5,1389 

0,061 




6,8727 

0,011 




4,5556 

0,100 




5,4545 

0,046 




4,2500 

0,121 




5,2364 

0,052 









4,5545 

0,098 









4,4455 

0,103 

3 

3 

3 

7,2000 

0,004 









6,4889 

0,011 









5,6889 

0,029 

4 

4 

3 

7,1439 

0,010 




5,6000 

0,050 




7,1364 

0,011 




5,0667 

0,086 




5,5985 

0,049 




4,6222 

0,100 




5,5758 

0,051 


4,5455 0,099 

4,4773 0,102 
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Tabela 5. Continuagao 


Tamanho da amostra 



Tamanho da amostra 



", 

"2 

"3 

H 

P 

", 

"2 

"3 

H 

P 

4 

1 

1 

3,5714 

0,200 






4 

2 

1 

4,8214 

0,057 

4 

4 

4 

7,6538 

0,008 




4,5000 

0,076 




7,5385 

0,011 




4,0179 

0,114 




5,6923 

0,049 

4 

2 

2 

6,0000 

0,014 




5,6538 

0,054 




5,3333 

0,033 




4,6539 

0,097 




5,1250 

0,052 




4,5001 

0,104 




4,4583 

0,100 

5 

1 

1 

3,8571 

0,143 




4,1667 

0,105 

5 

2 

1 

5,2500 

0,036 

4 

3 

1 

5,8333 

0,021 




5,0000 

0,048 




5,2083 

0,050 




4,4500 

0,071 




5,0000 

0,057 




4,2000 

0,095 




4,0556 

0,093 




4,0500 

0,119 




3,8889 

0,129 






5 

2 

2 

6,5333 

0,0008 




4,5487 

0,099 




6,1333 

0,013 




4,5231 

0,103 




5,1600 

0,034 









5,0400 

0,056 

5 

4 

4 

7,7604 

0,009 




4,3733 

0,090 




7,7440 

0,011 




4,2933 

0,122 




5,6571 

0,049 









5,6176 

0,050 

5 

3 

1 

6,4000 

0,012 




4,6187 

0,100 




4,9600 

0,048 




4,5527 

0,102 




4,8711 

0,052 









4,0178 

0,095 

5 

5 

1 

7,3091 

0,009 




3,8400 

0,123 




6,8364 

0,011 









5,1273 

0,046 

5 

3 

2 

6,9091 

0,009 




4,9091 

0,053 




6,8218 

0,010 




4,1091 

0,086 




5,2509 

0,049 




4,0364 

0,105 




5,1055 

0,052 









4,6509 

0,091 

5 

5 

2 

7,3385 

0,010 




4,4945 

0,101 




7,2692 

0,010 


5,3385 0,047 
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Tabela 5. Continuagao 


Tamanho da amostra 



Tamanho da amostra 



", 

n 2 

"3 

H 

P 

n , 

"2 

"3 

H 

P 


7,0788 

0,009 




5,2462 

0,051 

6,9818 

0,011 




4,6231 

0,097 

5,6485 

0,049 




4,5077 

0,100 

5,5152 

0,051 






4,5333 

0,097 

5 

5 

3 

7,5780 

0,010 

4,4121 

0,109 




7,5429 

0,10 






5,7055 

0,046 

6,9545 

0,008 




5,6264 

0,051 

6,8400 

0,011 




4,5451 

0,100 

4,9855 

0,044 




4,5363 

0,102 

4,8600 

0,056 






3,9873 

0,098 

5 

5 

4 

7,8229 

0,010 

3,9600 

0,102 




7,7914 

0,010 






5,6657 

0,049 

7,2045 

0,009 




5,6429 

0,050 

7,1182 

0,010 




4,5229 

0,099 

5,2727 

0,049 




4,5200 

0,101 

5,2682 

0,050 






4,5409 

0,098 






4,5182 

0,101 

5 

5 

5 

8,0000 

0,009 






7,9800 

0,010 

7,4449 

0,010 




5,7800 

0,049 

7,3949 

0,011 




5,6600 

0,051 

5,6564 

0,049 




4,5600 

0,100 

5,6308 

0,050 




4,5000 

0,102 


Fonte: SIEGEL, S. Nonparametric statistics. New York: McGraw-Hill, 1959. p. 282-283. 















Tabela 6. Valores crfticos de q para os testes nao parametricos de comparaqoes multiplas 


k 

a: 

0,50 

0,20 

0,10 

0,05 

0,02 

0,01 

0,005 

0,002 

0,001 

2 

0,674 

1,282 

1,645 

1,960 

2,327 

2,576 

2,807 

3,091 

3,291 

3 

1,383 

1,834 

2,128 

2,394 

2,713 

2,936 

3,144 

3,403 

3,588 

4 

1,732 

2,128 

2,394 

2,639 

2,936 

3,144 

3,342 

3,588 

3,765 

5 

1,960 

2,327 

2,576 

2,807 

3,091 

3,291 

3,481 

3,719 

3,891 

6 

2,128 

2,475 

2,713 

2,936 

3,209 

3,403 

3,588 

3,820 

3,988 

7 

2,261 

2,593 

2,823 

3,038 

3,304 

3,494 

3,675 

3,902 

4,067 

8 

2,369 

2,690 

2,914 

3,124 

3,384 

3,570 

3,748 

3,972 

4,134 

9 

2,461 

2,773 

2,992 

3,197 

3,453 

3,635 

3,810 

4,031 

4,191 

10 

2,540 

2,845 

3,059 

3,261 

3,512 

3,692 

3,865 

4,083 

4,241 

11 

2,609 

2,098 

3,119 

3,317 

3,565 

3,743 

3,914 

4,129 

4,286 

12 

2,671 

2,965 

3,172 

3,368 

3,613 

3,789 

3,957 

4,171 

4,326 

13 

2,726 

3,016 

3,220 

3,414 

3,656 

3,830 

3,997 

4,209 

4,363 

14 

2,777 

3,062 

3,264 

3,456 

3,695 

3,868 

4,034 

4,244 

4,397 

15 

2,823 

3,105 

3,304 

3,494 

3,731 

3,902 

4,067 

4,276 

4,428 

16 

2,866 

3,144 

3,342 

3,529 

3,765 

3,935 

4,098 

4,305 

4,456 

17 

2,905 

3,181 

3,376 

3,562 

3,796 

3,965 

4,127 

4,333 

4,483 

18 

2,942 

3,215 

3,409 

3,593 

3,825 

3,993 

4,154 

4,359 

4,508 

19 

2,976 

3,246 

3,439 

3,622 

3,852 

4,019 

4,179 

4,383 

4,532 

20 

3,008 

3,276 

3,467 

3,649 

3,878 

4,044 

4,203 

4,406 

4,554 

21 

3,038 

3,304 

3,494 

3,675 

3,902 

4,067 

4,226 

4,428 

4,575 

22 

3,067 

3,331 

3,519 

3,699 

3,925 

4,089 

4,247 

4,448 

4,595 

23 

3,094 

3,356 

3,543 

3,722 

3,947 

4,110 

4,268 

4,468 

4,614 

24 

3,120 

3,380 

3,566 

3,744 

3,968 

4,130 

4,287 

4,486 

4,632 

25 

3,144 

3,403 

3,588 

3,765 

3,988 

4,149 

4,305 

4,504 

4,649 


Fonte: ZAR, J.H. Biostatistical Analysis. New Jersey: Upper Saddle River, App. 107,1999. 


I 

Nota: P(q) <a—-— 

k(a-i) 
















Tabela 7 Valores criticos para c 2 r no teste de Friedman 





k = 3 






n = 2 


n = 3 


n = 4 


11-1 

c 2 

L r 

p-valor 

c 2 

L r 

p-valor 

c 2 

L r 

p-valor 

c 2 

L r 

p-valor 

0 

1,000 

0,000 

1,000 

0,0 

1,000 

0,0 

1,000 

1 

0,833 

0,667 

0,944 

0,5 

0,931 

0,4 

0,954 

3 

0,500 

2,000 

0,528 

1,5 

0,653 

1,2 

0,691 

4 

0,167 

2,667 

0,361 

2,0 

0,431 

1,6 

0,522 



4,667 

0,194 

3,5 

0,273 

2,8 

0,367 



6,000 

0,028 

4,5 

0,125 

3,6 

0,182 





6,0 

0,069 

4,8 

0,124 





6,5 

0,042 

5,2 

0,093 





8,0 

0,0046 

6,4 

0,039 







7,6 

0,024 







8,4 

0,0085 







10,0 

0,00077 


n = 6 


n = 7 


n = 8 


n = 9 

c 2 

L r 

p-valor 

c 2 

L r 

p-valor 

c 2 

L r 

p-valor 

c 2 

L r 

p-valor 

0,00 

1,000 

0,000 

1,000 

0,00 

1,000 

0,000 

1,000 

0,33 

0,956 

0,286 

0,964 

0,25 

0,967 

0,222 

0,971 

1,00 

0,740 

0,857 

0,768 

0,75 

0,794 

0,667 

0,814 

1,33 

0,570 

1,143 

0,620 

1,00 

0,654 

0,889 

0,865 

2,33 

0,430 

2,000 

0,486 

1,75 

0,531 

1,556 

0,569 

3,00 

0,252 

2,571 

0,305 

2,25 

0,355 

2,000 

0,398 

4,00 

0,184 

3,429 

0,237 

3,00 

0,285 

2,667 

0,328 

4,33 

0,142 

3,714 

0,192 

3,25 

0,236 

2,889 

0,278 

5,33 

0,072 

4,571 

0,112 

4,00 

0,149 

3,556 

0,187 

6,33 

0,052 

5,429 

0,085 

4,75 

0,120 

4,222 

0,154 

7,00 

0,029 

6,000 

0,052 

5,25 

0,079 

4,667 

0,107 

8,33 

0,012 

7,143 

0,027 

6,25 

0,047 

5,556 

0,069 

9,00 

0,0081 

7,714 

0,021 

6,75 

0,038 

6,000 

0,057 

9,33 

0,0055 

8,000 

0,016 

7,00 

0,030 

6,222 

0,048 

10,33 

0,0017 

8,857 

0,0084 

7,75 

0,018 

6,889 

0,031 

12,00 

0,00013 

10,286 

0,0036 

9,00 

0,0099 

8,000 

0,019 



10,571 

0,0027 

9,25 

0,0080 

8,222 

0,016 



11,143 

0,0012 

9,75 

0,0048 

8,667 

0,010 


Continua 


Tabela 7. Continuagao 


n = 6 n - 7 n = 8 n = 9 


c 2 

L r 

p-valor 

c 2 

L r 

p-valor 

c 2 

L r 

p-valor 

c 2 

L r 

p-valor 



12,286 

0,00032 

10,75 

0,0024 

9,556 

0,0060 



14,000 

0,000021 

12,00 

0,0011 

10,667 

0,0035 





12,25 

0,00086 

10,889 

0,0029 





13,00 

0,00026 

11,556 

0,0013 





14,25 

0,000061 

12,667 

0,00066 





16,00 

0,0000036 

13,556 

0,00035 







14,000 

0,00020 







14,222 

0,000097 







14,889 

0,000054 







16,222 

0,000011 







18,000 

0,0000006 





k = 4 





n = 2 


n = 3 



n = 4 


c 2 

L r 

p-valor 

c 2 

L r 

p-valor 

c 2 

L r 

p-valor 

c 2 

L r 

p-valor 

0,0 

1,000 

0,2 

1,000 

0,0 

1,000 

5,7 

0,141 

0,6 

0,958 

0,6 

0,958 

0,3 

0,992 

6,0 

0,105 

1,2 

0,834 

1,0 

0,910 

0,6 

0,928 

6,3 

0,094 

1,8 

0,792 

1,8 

0,727 

0,9 

0,900 

6,6 

0,077 

2,4 

0,625 

2,2 

0,608 

1,2 

0,800 

6,9 

0,068 

3,0 

0,542 

2,6 

0,524 

1,5 

0,754 

7,2 

0,054 

3,6 

0,458 

3,4 

0,446 

1,8 

0,677 

7,5 

0,052 

4,2 

0,375 

3,8 

0,342 

2,1 

0,649 

7,8 

0,036 

4,8 

0,208 

4,2 

0,300 

2,4 

0,524 

8,1 

0,033 

5,4 

0,167 

5,0 

0,207 

2,7 

0,508 

8,4 

0,019 

6,0 

0,042 

5,4 

0,175 

3,0 

0,432 

8,7 

0,014 



5,8 

0,148 

3,3 

0,389 

9,3 

0,012 



6,6 

0,075 

3,6 

0,355 

9,6 

0,0069 



7,0 

0,054 

3,9 

0,324 

9,9 

0,0062 



7,4 

0,033 

4,5 

0,242 

10,2 

0,0027 



8,2 

0,017 

4,8 

0,200 

10,8 

0,0016 



9,0 

0,0017 

5,1 

0,190 

11,1 

0,00094 





5,4 

0,158 

12,0 

0,000072 


Fonte: MINIUM, E.W.; CLARKE, R.C.; COLADARCI, T. Elements of Statistical Reasoning. New York: Wiley, 1999. p. 473-475. 


Tabcla 8. Valores criticos para r s , o coeficiente de correlagao de Spearman 

n Nivel de significancia para teste unilateral Nivel de significancia para teste bilateral 



0,05 

0,01 

0,05 

0,01 

4 

0,8000 

- 

- 

- 

5 

0,8000 

0,9000 

0,9000 

- 

6 

0,7714 

0,8857 

0,8286 

0,9426 

7 

0,6786 

0,8571 

0,7450 

0,8929 

8 

0,6190 

0,8095 

0,7143 

0,8571 

9 

0,5833 

0,7667 

0,6833 

0,8167 

10 

0,5515 

0,7333 

0,6364 

0,7818 

11 

0,5273 

0,7000 

0,6091 

0,7545 

12 

0,4965 

0,6713 

0,5804 

0,7273 

13 

0,4780 

0,6429 

0,5549 

0,6978 

14 

0,4593 

0,6220 

0,5341 

0,6747 

15 

0,4429 

0,6000 

0,5179 

0,6536 

16 

0,4265 

0,5824 

0,5000 

0,6324 

17 

0,4118 

0,5637 

0,4853 

0,6152 

18 

0,3994 

0,5480 

0,4716 

0,5975 

19 

0,3895 

0,5333 

0,4579 

0,5825 

20 

0,3789 

0,5203 

0,4451 

0,5684 

21 

0,3688 

0,5078 

0,4351 

0,5545 

22 

0,3597 

0,4963 

0,4241 

0,5426 

23 

0,3518 

0,4852 

0,4150 

0,5306 

24 

0,3435 

0,4748 

0,4061 

0,5200 

25 

0,3362 

0,4654 

0,3977 

0,5100 

26 

0,3299 

0,4564 

0,3894 

0,5002 

27 

0,3236 

0,4481 

0,3822 

0,4915 

28 

0,3175 

0,4401 

0,3749 

0,4828 

29 

0,3113 

0,4320 

0,3685 

0,4744 

30 

0,3059 

0,4251 

0,3620 

0,4665 


Fonte: MINIUM, E.W.; CLARKE, R.C.; COLADARCI, T. Elements of Statistical Reasoning. New York: Wiley, 1999. p. 473-475. 


• • • 



Respostas dos Exercfcios 



CAPITULO 1 


1.5.1. Variaveis: a) densidade ossea: contmua; b) marcas comerciais de um mesmo analgesico: variavel nominal; c) comprimento 

de implantes: variavel continua; d) gosto (doce ou amargo): nominal; e) sexo: nominal; f) numero de dentes permanentes 
irrompidos em uma crianga: variavel discreta; g) numero de pacientes atendidos por dia em um consultorio: discreta; h) 
altura da face: contmua; i) qualidade percebida do atendimento (bom, normal, ruim): ordinal. 

1.5.2. a) O pesquisador pode conferir notas as diversas tomadas radiograficas de um mesmo corpo de prova, feitas por diferentes 

tecnicas e/ou diferentes aparelhos. b) O pesquisador pode classificar os pacientes como ja tratados ou virgens de 
tratamento. 

1.5.3. Idade: numerico, discreto; sexo: categorizado, nominal; escolaridade: categorico, ordinal; doengas presentes: categorizado, 

nominal; pressao arterial: numerico, continuo; uso de medicamentos: categorico, nominal; alergico a aspirina: categorico, 
nominal; disposigao em participar de um experimento: categorizado, nominal. 

1.5.4. A nota 2. 

1.5.5. Voce pode pedir as maes para preencher as escalas, ao longo do tratamento ou apos segoes em branco (em que o dentista 

apenas apresenta o consultorio ou o instrumental a crianga ou so examina a crianga ou mostra outra crianga sendo tratada 
etc.). Parece mais facil, porem, dar uma lista de palavras simples, que descrevam o que a crianga expressa. 

1.5.6. Parece razoavel considerar que a ultima questao do questionario foi escrita de maneira a obter o numero de nao 

respondentes e/ou respostas inadequadas, por conta da nao compreensao da questao. 

1.5.7. E claro que o rato que nao dormiu nao o fez no tempo estipulado. O dado e censurado. 

1.5.8. Sexo: categorizado, nominal; idade: numerico, discreto; peso: numerico, continuo; estatura: numerico, continuo; doengas: 

categorizado, nominal; tratamento medico: categorizado, nominal; esporte que pratica: categorizado, nominal. 

1.5.9. Ordinal. 

1.5.10. Falso. Talvez tenha mais dados perdidos. 


CAPITULO 2 

2.5.1. a) H 0 : a nova droga produz o mesmo efeito que a tradicional contra Hj: a nova droga produz efeito diferente da traditional; 

b) H 0 : a dieta em questao nao aumenta a longevidade contra a dieta aumenta a longevidade; c) H 0 : o produto nao e 
cancerigeno contra o produto e cancerigeno; d) El 0 : a vitamina nao melhora o desempenho de atletas contra El 1 : a 
vitamina melhora o desempenho de atletas. 

2.5.2. Resposta 1. Aumentar o tamanho da amostra torna o teste de hipoteses mais propenso a rejeitar a hipotese da nulidade 

quando e, de fato, falsa. Assim, aumenta o poder do teste. O efeito do tratamento nao e afetado pelo tamanho da amostra. 
A probabilidade de cometer erro Tipo II fica menor, nao maior, a medida que o tamanho da amostra aumenta. 


2.5.3. Velocidade de leitura. 


2.5.4. H 0 : a moeda e bem balanceada, isto e, a probabilidade de sair cara e exatamente 0,5. Se isso for verdade, a probabilidade de 

sai'rem seis caras quando se lan^a a moeda e 0,015625. No entanto, se a moeda for bem balanceada e ocorrerem seis 
caras, voce rejeita H 0 : esta af o p-valor, 0,015625. Esse e um teste unilateral. Neste caso, Hp a probabilidade de sair cara 
na moeda e maior do que 0,5. Se voce resolveu por um teste unilateral, voce tinha alguma razao para supor que nos 
lanqamentos dessa moeda ocorrem mais caras. Se isso nao for verdade, faqa um teste bilateral. Nesse caso, Hjj a 
probabilidade de sair cara na moeda e diferente de 0,5 e o p-valor e 0,031250. 

2.5.5. Para definir a populaqao, e importante saber de onde veio a amostra (centro cirurgico) e uma descriqao dos criterios de 

inclusao. Por exemplo, sao muitos doentes em estado grave? De que idade? 

2.5.6. Rejeitar H 0 quando H 0 e falsa. 

2.5.7. H 0 : a droga A produz o mesmo efeito que a droga B contra Hp a droga A produz efeito diferente da droga B. 

2.5.8. H 0 : o nivel do hormonio em estudo e o mesmo, tanto em mulheres jovens que nao estao em gestaqao como em mulheres 

jovens que estao no primeiro trimestre de gestaqao, contra Hp o nivel do hormonio em estudo e maior em mulheres 
jovens que estao em gestaqao do que em mulheres jovens que nao estao no primeiro trimestre de gestaqao. 

Com base no resultado do teste, pode-se dizer que gestantes tern maior quantidade desse hormonio (p-valor = 0,001). 

2.5.9. A probabilidade de o pesquisador ter obtido o resultado que obteve por acaso e [0,05. 

2.5.10. Resposta 3, porque 1) Aumentar o tamanho da amostra torna o teste mais propenso a rejeitar a hipotese da nulidade 
quando e, de fato, falsa. 2) Aumentar o nivel de significancia reduz a regiao da aceitaqao; isso aumenta a probabilidade de 
rejeitar a hipotese da nulidade, aumentando assim o poder do teste. 3) Por definiqao, o poder do teste e igual a um menos 
beta, logo, o poder de um teste ficara menor a medida que o beta for maior. 


Poder 




CAPITULO 3 















r, . . X’"' W + 1 

3.4.1. \ R = „x - = 55 

^ 2 

3.4.2. a) Hipotese da nulidade: a variavel tern igual distribuiqao nos dois grupos e a hipotese alternativa e de que de isso nao 

acontece. b) oR 1 = 25; os valores criticos de o R 1 no nivel de significancia de 5% sao 11 a 29. Como o valor calculado 
para ol? 1 esta entre os valores criticos, nao rejeite H 0 . c) As duas linhagens de ratos de laboratorio nao diferem quanto a 
habilidade de correr labirinto. d) 5 R 2 = 20 e 




n + 1 
2 


25+ 20 = 9 X 


10 

y 


= 45 


Atribuiijao dos postos 


Grupo 

Dado 

Posto 

Grupo 

Dado 

Posto 

E 

14,3 

1 




E 

14,6 

2,5 




E 

14,6 

2,5 




E 

14,7 

4 




E 

14,9 

5 







C 

15,5 

6,5 




C 

15,5 

6,5 

E 

15,8 

8 




E 

16,1 

9 




E 

16,4 

10 







c 

16,7 

11,5 




c 

16,7 

11,5 

E 

16,8 

14 







c 

16,8 

14 




c 

16,8 

14 

E 

17,2 

16,5 







c 

17,2 

16,5 




c 

17,6 

18 




c 

17,9 

19 




c 

18 

20 



72,5 



137,5 


oR 1 = 72,5 e oR 2 = 137,5; U = 17,5; z = -2,45677, p-valor = 0,014025, significante ao nivel de 5%. Fazendo a corre^ao 
para os empates: z = -2,46419, p-valor = 0,013737, significante no nivel de 5%. 

3.4.4. 51^ = 50,5 e 5 R 2 = 102,5; U = 14,5; z = -2,06884, p-valor = 0,038569, significante no nivel de 5%. 


3.4.5. 



Atribuigao dos postos 


Restaurante 

Antes 

Depois 

Diferenga 

Posto assinalado 

1 

80 

90 

-10 

-7 

2 

83 

85 

-2 

-1,5 

3 

82 

87 

-5 

-4,5 

4 

81 

78 

3 

3 

5 

77 

75 

2 

1,5 

6 

77 

82 

-5 

-4,5 

7 

65 

75 

-10 

-7 

8 

67 

85 

-18 

-10 

9 

75 

90 

-15 

-9 

10 

85 

95 

-10 

-7 


n = 10; T = 4,5; z = 2,34438 significante no nivel de 5%, p-valor = 0,019065. O seminario foi eficaz. 

3.4.6. A mediana e 55. O valor de e 6,3427 significante no nivel de 5%. O p-valor e 0,0118. 


Dados em rela^ao a mediana 

Conformistas 

Grupos 

Nao conformistas 

Total 

Menores ou iguais a mediana 

8 

2 

10 

Maiores que a mediana 

2 

7 

9 

Total 

10 

9 

19 


3.4.7. Como a amostra e pequena (n = 8), o certo e nao usar a aproximagao normal. Se for essa a opgao, procure o valor critico 

para T na Tabela 4 do Apendice (lembre-se de que Tea menor soma de postos em valor absoluto). Para ~ = 0,05 e 
amostras de tamanho n = 8, o valor critico e 4. Como a menor soma obtida desprezando o sinal e T = 4, voce pode 
afirmar, no nivel de 5% de significance, que o ansiolitico tern efeito sobre pacientes que vao se submeter a extragao de 
varios dentes. 

3.4.8. Descartando os empates, n = 18; z = 1,65, nao significante no nivel de 5%. 

3.4.9. 5J?! = 42,5 e 5 R 2 = 62,5; U = 21,5; z = - 0,323, nao significante no nivel de 5%. 

3.4.10. 5=23; 5 R 2 = 55; U = 2; valor critico = 5; significante no nivel de 5%. 


CAPITULO 4 

4.3.1. 


Atribuigao de postos 


Grupo 

Estatura 

Posto 

Grupo 

Estatura 

Posto 

Grupo 

Estatura 

Posto 




B 

1,68 

1 





A 


1,69 


2 


A 


1,7 


3 






C 

1,73 

4 




B 

1,74 5 



A 

1,75 

6 

B 

1,76 7 







C 

1,77 

8 

A 

1,78 

9 

B 

1,79 10 






B 

1,8 11 







C 

1,81 

12 

A 

1,82 

13 


C 

1,84 

14 





C 

1,89 

15 



33 


34 


53 

n = 15; oR 3 

= NNT oR 2 = 

34; oR 3 = 53; H = 

2,54, com 

2 graus de liberdade, nao significante no m'vel de 5%. 


4.3.2. 




Atribuigao de postos 



Escore 

Negro 

Posto 

Escore 

Latino Posto Escore 

Branco 

Posto 

1 

N 

1 


2 

B 

2 

3 

N 

3,5 


3 

B 

3,5 




4 

L 5 






5 

L 6,5 







5 

B 

6,5 

6 

N 

8 





7 

N 

9 


8 

B 

10 

9 

N 

11 





10 

N 

12,5 


10 

B 

12,5 

Escore 

Negro 

Posto 

Escore 

Latino Posto Escore 

Branco 

Posto 

11 

N 

14 

12 

L 15,5 







12 

B 

12,5 




13 

L 17 







14 

B 

18 


15 


L 


19 


16 


20 


17 

L 

21 

18 

B 

22 

22 

L 

25 

23 

B 

26 




25 

B 

27 

27 

L 

28 




29 

L 

29 




30 

L 

30 






196 



143 


n = 30; 5 R 1 = MrpPT 5 R 2 = 196; o R 3 = 143; H = 3,44, corrigido para os empates, com 2 graus de liberdade, nao significante no 
nivel de 5%. O p-valor e 0,1788. 

4.3.3. Mediana geral = 7,9, % 2 = 9,60, com 3 graus de liberdade, significante no nivel de 5%; p-valor = 0,0223. 


Calculos intermediaries: frequences observadas 


Condi^ao 

A 

B 

C 

D 

Total 

Menores ou iguais a mediana 

8 

9 

2 

6 

25 

Maiores que a mediana 

4 

3 

10 

6 

23 

Total 

12 

12 

12 

12 

48 


4.3.4. 5 R 3 =19,5; 5 R 2 =26,5; oR 3 = 20,5; 5 R 4 = 33,5; % 2 = 7,25 com 3 graus de liberdade, nao significante no nfvel de 5%. Se 
puder usar computador, faga o teste com corregao para os empates, o que e o mais certo. Sem a corregao, voce praticou os 
calculos. Com a corregao, = 7,979 com 3 graus de liberdade, significante no nivel de 5%. 

4.3.5 Mediana geral = 25; = 5,57, com 2 graus de liberdade, nao significante no nivel de 5%. 

4.3.6 oR 1 =21; 5 R 2 =38; oR 3 = 61; u = 8,06 com 2 graus de liberdade, significante no nivel de 5%. O p-valor e 0,00178. Para o 

teste de Dunn 


n(n + l) ( 1 | / l5 x 16 4 1 

12 U + "J V 12 


j = ^20x | = 2,828427 


Tabela resumo dos resultados do teste de Dunn 


Compara^ao 

Diferenga dos postos medios 

Q 

Q critico 

Conclusao 

A versus B 

-3,4 

-1,202081 

2,394 

Nao rejeita H ( 

A versus C 

-8,0 

-2,828427 

2,394 

Rejeita H 0 

B versus C 

-4,6 

-1,626345 

2,394 

Nao rejeita H ( 






4.3.7. 


Atribuigao dos postos 


GrupoI 

Grupo II 

Grupo III 

4 

16 

10 

7 

18 

20 

3 

15 

2 

8 

11 

22 

14 

17 

21 

9 

13 

19 

6 



1 



5 



12 



SR X = 69 

SR 2 = 90 

SR 3 = 94 


H = 9,232 com 2 graus de liberdade, significante no m'vel de 1%. Postos medios: grupo I: 6,90; grupo II: 15,00; grupo III: 
15,67. 


Tabela resumo dos resultados do teste de Dunn 


Comparagao 

Diferenga dos postos medios 

Q 

Q critico 

Conclusao 

I versus II 

8,1 

2,42 

2,394 

Rejeita H 0 

I versus III 

8,77 

2,42 

2,394 

Rejeita H 0 

II versus III 

0,67 

2,16 

2,394 

Nao rejeita H 0 

Mediana geral = 33,0; % 2 = 25,53, com 3 graus de liberdade, significante no nivel de 5%. 


Condi^ao 


Comimidade 


Total 


Muito isolada 

Isolada 

Rural 

Favela 

Menor ou igual a mediana 

21 

13 

8 

5 47 

Maior do que a mediana 

2 

10 

15 

18 45 


4.3.9. oi? 1 = 19,5; 5 R 2 = 9,0; 5R 3 = 25,5; = 15,94 com 2 graus de liberdade, significante no m'vel de 5%. 


Tabela resumo para o teste de comparagoes multiplas para o exemplo 6.6, ~ =0,10 


Comparagao 

A versus B 
A versus C 


Ri-Rj 

19,5 - 9| = 10,5 
119,5-25,5| = 6 
|9 - 25,5| = 16,5 


Valor critico 

8,697 

8,697 


Conclusao 

Rejeita H 0 
Nao rejeita H ( 
Rejeita H 0 


B versus C 


8,697 


Conclui-se que A e B dao resultados diferentes, assim como B e C. 


4.3.10. 5 R 1 =29; 5R 2 =21; o R 3 = 10; = 18,20 com 2 graus de liberdade, significante no m'vel de 5%. 


CAPITULO 5 

5.5.1 O estudo e transversal. A hipotese da nulidade e a de que a maneira de descartar o lixo nao depende do sexo. A hipotese 

alternativa e a de que a maneira de descartar o lixo depende do sexo. 

O valor de sem corregao de continuidade e 2,000, p-valor 0,1573. O valor de com corregao de continuidade e 
1,389, p-valor 0,2386. Com a corregao, diminui a estatistica (de 2,000 para 1,389). 

5.5.2 O estudo e transversal. A hipotese da nulidade e a de que o medo de viajar de aviao nao esta associado a partida ou chegada. 

O valor de % 2 sem corregao de continuidade e 8,30, p-valor 0,0040. Portanto, existe associagao. Passageiros revelam 
mais medo ao chegar. 

ProporgSes dos passageiros entrevistados segundo a situagao de chegada ou partida e o medo de voar 


Passageiros 

Sim 

Medo 

Nao 

Total 

Chegavam 

0,162 


0,438 

0,6 

Partiam 

0,064 


0,336 

0,4 

Total 

0,226 


0,774 

1 


5.5.3 Os dados sao de um estudo transversal. A hipotese da nulidade e de que a prevalencia de sobrepeso nao esta associada a 
geragao. Entao foi construida a tabela dada em seguida. O valor de % 2 sem corregao de continuidade e 24,21, p-valor = 
0,0000. A segunda geragao apresentou prevalences elevadas de sobrepeso, significativamente maiores do que a primeira. 

Distribuigao percentual dos nipo-brasileiros com sobrepeso,segundo a geragao (Bauru SP, 2000) 


Geragao 

Sim 

Sobrepeso 

Nao 

Total 

Primeira 

0,062 


0,132 

0,193 

Segunda 

0,395 


0,412 

0,807 

Total 

0,456 


0,544 

1 


5.5.4 Os dados sao de um ensaio clinico. A hipotese da nulidade e a de que a prevalencia de dor e a mesma nos dois grupos. O 

teste de proporgoes bilateral com corregao de continuidade fornece o valor z = 2,545, significante no m'vel de 5%. O p- 
valor e 0,0109. A proporgao dos participantes da pesquisa sem dor no grupo controle e 0,571 e no grupo experimental e 
0,118. Portanto, o uso de betametasona diminui a prevalencia de dor no pos-operatorio de pacientes submetidos a 
tratamento endodontico. 

5.5.5 Os dados sao de um ensaio clinico. A hipotese da nulidade e a de que a taxa de sobrevivencia e a mesma nos dois grupos. 

Amostra pequena, teste exato de Fisher. 


Valores observados 


Grupo 

Sim 

Vivos 5 anos depois 

Nao 

Total 

Tratado 

4 


1 

5 

Controle 

2 


3 

5 

Total 

6 


4 

10 


Valores mais extremos do que os observados 


Grupo 

Sim 

Vivos 5 anos depois 

Nao 

Total 

Tratado 

5 


0 

5 

Controle 

1 


4 

5 

Total 

6 


4 

10 


A probabilidade de os valores observados ocorrerem e de 0,2381. A probabilidade de ocorrerem valores mais extremos do 
que os observados e de 0,0238. Entao p-valor = 0,2619. Os dados nao trazem evidencia de que o tratamento ajudou. 

5.5.6 Os dados sao de um estudo transversal. A hipotese em teste e a de que a prevalencia de gengivite nao esta associada ao 

habito de fumar. O valor do para o teste de qui-quadrado sem corregao de continuidade e 2,747, p-valor 0,0975, e com 
corregao de continuidade e 2,101, p-valor 0,1472; os dois resultados sao nao significantes (p < 0,05). 

5.5.7 Para testar H 0 , de que as respostas sao consistentes, e preciso reconstruir a tabela, de maneira que a e d sejam mudangas de 

respostas. 


Tinham dor antes 

Tinham dor depois 


Total 


Nao 

Sim 


Sim 

785 

380 

1.165 

Nao 

215 

75 

290 

Total 

1.000 

455 

1.455 


* 2 = 


(|q — d| - 1 
a + d 


* 2 = 


( 1785 - 75 | - 1 ) 2 
785 + 75 


= 584,513 


O resultado e extremamente significante (p < 0,0001). Entao, o tratamento teve efeito: 91,279% dos que tinham dor 
passaram a nao ter, enquanto 8,728% dos que nao tinham dor passaram a ter. 


5.5.8 O estudo e transversal. A hipotese da nulidade e a de que o disturbio da articulagao temporomandibular (DTM) nao depende 
de sexo. 


Distribuigao de 604 criangas e adolescentes de acordo com sexo e disturbio da articulagao temporomandibular (DTM)(Proporgao 

entre parenteses) 


Sexo 


DTM 


Total 





Sim 

Nao 


Masculino 

118 (0,195) 

146 (0,242) 

264 (0,437) 

Feminino 

177 (0,293) 

163 (0,270) 

340 (0,563) 

Total 

295 (0,488) 

309 (0,512) 

604 (1,000) 


O valor de qui-quadrado sem corregao de continuidade e 3,220, p-valor = 0,0726. O valor de qui-quadrado com corregao 
de continuidade e 2,940, p-valor = 0,0867. Nao se rejeita a hipotese de que sexo e disturbio da articulagao 
temporomandibular (DTM) sejam independentes. 


5.5.9 


Distribuigao das mulheres dos dois grupos segundo o uso ou nao de aspirina 


Grupo 

Sim 

Aspirina 

Nao 

Total 

Proporgao de usuarias 

Tratado 

1.623 

6.883 

8.506 

0,191 

Controle 

1.631 

6.471 

8.102 

0,201 

Total 

3.254 

13.354 

16.608 

0,196 


A proporgao de usuarias de aspirina e de 19,1% no grupo tratado e de 20,1% no grupo controle. Nao ha diferenga 
estatistica quanto a essa caracteristica (p = 0,0883). 

5.5.10 O estudo e transversal. A hipotese da nulidade e a de que a etiologia do trauma de face nao depende de sexo. O valor de 
qui-quadrado com corregao de continuidade e 2,27, p-valor = 0,1323. Nao se rejeita a hipotese de que sexo e etiologia do 
trauma de face sejam independentes. 


CAPITULO 6 


6.6.1. O valor calculado de % 2 e 13,62, com 3 graiis de liberdade. A tabela de % 2 da, para o nivel de significancia de 1% e com 3 

graus de liberdade, o valor 11,34. Como o valor calculado e maior do que o da tabela, conclui-se que o tipo sanguineo 
esta associado a origem. 

6.6.2. O valor calculado de % 2 e 16,86, com 7 graus de liberdade. A tabela de % 2 da, para o nivel de significancia de 5% e com 7 

graus de liberdade, o valor 14,07. Como o valor calculado e maior do que o valor critico, pode-se concluir que a 
confirmaqao da denuncia esta associada ao perfil do denunciante. 


Percentuais de denuncias confirmadas e nao confirmadas segundo o perfil do notificante 


Perfil do notificante 


Familiares 
Amigos e vizinhos 
Anonimo 
Desconhecido 


Denuncia 


Nao confirmada 

Confirmada 

24,00% 

8,50% 

23,90% 

3,70% 

14,30% 

2,40% 

9,40% 

1,00% 

3,70% 

0,50% 


Profissionais 


A propria crianga 

3,40% 

0,30% 

Outros 

4,10% 

0,70% 

Total 

82,80% 

17,20% 


6.6.3. Para analisar os dados aplicando o teste % 2 , e preciso reunir disfungao moderada e disfungao severa em uma so categoria. 

No entanto, seria melhor - o que nem sempre o tempo e o orgamento permitem - aumentar o tamanho da amostra. 

6.6.4. Testar a hipotese de independence. 

6.6.5. O valor calculado de ^ 2 e 4,16, com 2 gratis de liberdade. O valor crltico de com 2 gratis de liberdade e no nlvel de 

significance de 5% e 5,99. Nao se detectou associagao entre a resposta do paciente e a combinagao de drogas. A partigao 
da tabela foi, entao, feita como mostrado em seguida. O valor do % 2 , com 1 grau de liberdade, e 3,85, significante no 
nlvel de 5%. O p-valor e 0,0498. A combinagao com candesartan deu, proporcionalmente, mais respostas positivas. 

Pacientes com resposta positiva ou negativa segundo a combinagao de drogas 


Droga 

Resposta do paciente 

Total 

Percentual de respostas positivas 


Positiva 

Negativa 



Candesartan 

95 

44 

139 

68,30% 

Losartan 

75 

57 

132 

56,80% 

Total 

170 

101 

271 

62,70% 


6.6.6. O estudo e transversal. A hipotese da nulidade e de que a resposta “Nao” independe do tipo de profissional. O valor de % 2 
e 12,1307, significante no nivel de 5%. O p-valor e 0,016405. A hipotese da nulidade foi, portanto, rejeitada. 


Calculos auxiliares para obtengao do valor de % 2 


Tipo de profissional 

o 

E 

(O-E) 

(O-E) 2 

(0-E) 2 /E 


Respostas' 

"Sim” 




Enfermeiro 

264 

255 

9 

81 

0,31765 

Auxiliar de enfermagem 

254 

255 

-1 

1 

0,00392 

Parteira 

258 

255 

3 

9 

0,03529 

Tecnico 

237 

255 

-18 

324 

1,27059 

Outros 

262 

255 

7 

49 

0,19216 


Respostas 1 

“Nao” 




Enfermeiro 

36 

45 

-9 

81 

1,80000 

Auxiliar de enfermagem 

46 

45 

1 

1 

0,02222 

Parteira 

42 

45 

-3 

9 

0,20000 

Tecnico 

63 

45 

18 

324 

7,20000 

Outros 

38 

45 

-7 

49 

1,08889 

Total 

1.500 

1.500 

0 


12,13072 


Para fazer o procedimento de Marascuilo, e preciso calcular: 


Adotando o m'vel de 5% de significancia, o valor critico de % 2 com 4 graus de liberdade e 9,488 e a raiz quadrada desse 
valor e 3,080. 


Uma diferenga e estatisticamente significante se seu valor excede o valor da amplitude crltica. Neste exemplo, embora o 
teste de % 2 tenha rejeitado a hipotese de que a resposta “Nao” independe do tipo de profissional, o procedimento de 
Marascuilo nao detectou onde esta a diferen^a. O contato entre enfermeiro e tecnico se aproxima, porem, da amplitude 
crltica, indicando que uma amostra maior talvez mostrasse a diferenqa entre esses dois tipos de profissionais. 


Tabela-resumo para o procedimento de Marascuilo 


(Diiipar.it ,in 

Contraste 

Amplitude critica 


Conclusao 

E-A 

0,033 

0,086 


Nao 

E-P 

0,020 

0,085 


Nao 

E-T 

0,090 

0,093 


Nao 

E-O 

0,007 

0,083 


Nao 

A-P 

0,013 

0,089 


Nao 

A-T 

0,057 

0,097 


Nao 

A-O 

0,026 

0,087 


Nao 

P-T 

0,070 

0,095 


Nao 

P-O 

0,013 

0,086 


Nao 

T-O 

0,083 

0,094 


Nao 

1.6.7. O estudo e transversal. A hipotese da nulidade 
do sexo. 

e a de que a idade em que se comega a usar lentes de contato nao depende 

Frequences esperadas de usuarios de lentes de contato classificados de acordo com o sexo e a idade em 

esse tipo de lente 

que comeijaram a usar 

Sexo 


Faixa de idade, em anos 




Menos de 15 

De 15 a 19 

20 e mais 

Total 

Homens 

3,4831 

45,6292 

12,8876 

62 

Mulheres 

6,5169 

85,3708 

24,1124 

116 

Total 

10 

131 

37 

178 


Valores calculados para (O - E) 2 /E 



Sexo 


Faixa de idade 


Total 


Menos de 15 

De 15 a 19 

20 e mais 


Homens 

0,631533164 

1,275605997 

6,4430023 

8,350141 

Mulheres 

0,337543588 

0,681789412 

3,4436736 

4,463007 

Total 

0,969076752 

1,95739541 

9,8866759 

12,81315 






O valor de (12,81315) e significante a 5%. Rejeita-se H 0 . 


6 . 6 . 8 . O estudo e transversal. A hipotese da nulidade e a de que a resposta independe do grupo. O valor de e 7,4063 com (3-1) 
(4-1) = 6 grans de liberdade, nao significante no nrvel de 5%. O p-valor e 0,2849. Veja as proporgoes de respostas “Sim”. 


O medico cirurgiao HIV-positivo pode continuar exercendo sua profissao? 


Respondentes 

Estudantes Basico 

Clinico 

Medicos Residentes 

Pos-residentes 

Total 

Sim Nao Nao declarou Total 

38 17 5 60 

49 8 3 60 

16 2 2 20 

23 6 1 30 

126 33 11 170 

Calculos intermediarios para aplicar o teste de % 2 

I'ropoiT.io de “Sim” 

63,30% 

81,70% 

80,00% 

76,70% 

74,10% 

Grupo 

o 


E 

( O-E ) 

Resposta "Sim" 

(O-E) 2 

(0-E) 2 /E 

Estudante basico 

38 


44,47059 

-6,47059 

41,8685 

0,9415 

Estudante clinico 

49 


44,47059 

4,529412 

20,5156 

0,4613 

Medico residente 

16 


14,82353 

1,176471 

1,3841 

0,0934 

Pos-residente 

23 


22,23529 

0,764706 

Resposta "Nao" 

0,5848 

0,0263 

Estudante basico 

17 


11,64706 

5,352941 

28,6540 

2,4602 

Estudante clinico 

8 


11,64706 

-3,64706 

13,3010 

1,1420 

Medico residente 

2 


3,882353 

-1,88235 

3,5433 

0,9127 

Pos-residente 

6 


5,823529 

0,176471 

Sem declaragao 

0,0311 

0,0053 

Estudante basico 

5 


3,882353 

1,117647 

1,24914 

0,32175 

Estudante clinico 

3 


3,882353 

-0,88235 

0,77855 

0,20054 

Medico residente 

2 


1,294118 

0,705882 

0,49827 

0,38503 

Pos-residente 

Total 

1 

170 


1,941176 

170 

-0,94118 

0 

0,88581 

0,45633 

7,40633 


Ha frequences esperadas menores do que 5. Entao, o teste nao deve ser aplicado. No entanto, o resultado e nao 
significante. Como questionarios sem resposta a pergunta foram poucos, isto e, 11 em 170, o que significa 6,5% da 
amostra, e razoavel desprezar esses dados e fazer o teste com respostas “Sim” e “Nao”. 


Calculos intermediarios para aplicar o teste de J£ 2 


Grupo 

o 

E 

(O-E) 

(O-E) 2 

(0-E) 2 /E 




Resposta "Sim" 


Estudante basico 

38 

43,58 

-5,58 

31,1364 

0,7145 

Estudante clinico 

49 

45,17 

3,83 

14,6689 

0,3247 


Medico residente 

16 

14,26 

1,74 

3,0276 

0,2123 

Pos-residente 

23 

22,98 

0,02 

0,0004 

0,0000 




Resposta "Nao" 


Estudante basico 

17 

11,42 

5,58 

31,1364 

2,7265 

Estudante clinico 

8 

11,83 

-3,83 

14,6689 

1,2400 

Medico residente 

2 

3,74 

-1,74 

3,0276 

0,8095 

Pos-residente 

6 

6,02 

-0,02 

0,0004 

0,0001 

Total 

159 

159 

0 


6,0276 


Ha frequencia esperada menor do que 5. Entao, o teste nao deve ser aplicado. No entanto, o resultado e nao significante. 
Compare respostas dos estudantes com respostas de medicos em uma tabela 2 | 2. Com corregao de continuidade, o 
resultado e qui-quadrado igual a 0,289, nao significante. 

6 . 6 . 9 . a) O valor calculado de y 2 e 16,024, com 3 graus de liberdade. O valor critico de y 2 , para o nivel de significancia de 1% e 
com 3 graus de liberdade, e 11,34. Como o valor calculado e maior do que o valor critico, conclui-se que existe 
associagao entre o tamanho do carcinoma de celulas renais e o tipo de detecgao. E facil ver na tabela a seguir que o 
percentual de tumores detectados por sintomas aumenta em fungao do tamanho. 

Carcinoma de celulas renais segundo o tamanho do tumor, em centimetros, e o tipo de detecgao 


Tipo de detec^ao 


Tamanho do tumor (cm) 



De 0,5 a 4 

De 4 a 7 

De 7 a 10 

Maior que 10 

Incidental 

30 

21 

5 

3 

Sintomatico 

11 

22 

14 

9 

Total 

41 

43 

19 

12 

Percentual (sintoma) 

26,8 

51,2 

73,7 

75 


b) O valor de y 2 ten( j com 1 grau de liberdade e 2,797. O valor critico de y 2 no nivel de significancia de 5% e com 1 grau 
de liberdade e 3,84. 

Como o valor calculado e menor do que o valor critico, os dados nao foram suficientes para mostrar tendencia estatistica 
de a detecgao por sintomas aumentar a medida que aumenta o tamanho do carcinoma de celulas renais. 

6 . 6 . 10 . O valor calculado de y 2 e 8,86, com 1 grau de liberdade. O valor critico de y- 1 no nivel de significancia de 5% e com 1 
grau de liberdade e 3,84. O valor calculado e maior do que o valor critico de y 2 , sugerindo o efeito da amidalectomia no 
desenvolvimento de mononucleose. 


CAPITULO 7 

7 . 4 . 1 . y 2 = 3,0312, nao significante no nivel de 5%; coeficiente $ = 0,266. Associagao pequena. 

7 . 4 . 2 . y 2 = 23,36 sem corregao, significante no nivel de 1%; p-valor = 0,0000; y 2 = 22,93 com corregao de Yates, significante 

no nivel de 1%; p-valor = 0,0000; coeficiente $ = 0,1066. Entao, embora o valor do teste possa parecer impressionante, a 
associagao e pequena: revelou-se significante devido ao tamanho da amostra. Note que o percentual de meninos com 
habitos orais nocivos na amostra e 22,3% e o percentual de meninas e 26,5%, valores bastante proximos. 


7.4.3. = 6,51 sem corregao, significante no nivel de 5%; p-valor = 0,0107; = 5,81 com corregao de Yates, significante no 

nivel de 5%; p-valor = 0,0160; coeficiente gama = 0,3496. Existe associagao positiva entre as escolaridades das mulheres 
e seu conhecimento sobre o exame Papanicolaou. 

7.4.4. = 8,81 sem corregao, significante no nlvel de 5%; p-valor = 0,0030; = 5,45 com corregao de Yates, significante no 

nivel de 5%; p-valor = 0,0196; risco de obito neonatal no caso de gestantes diabeticas = 12,5%; risco de obito neonatal no 
caso de gestantes nao diabeticas = 2,5%; risco relativo = 5,06, ou seja, o risco de obito neonatal e 5 vezes maior no caso 
de gestantes diabeticas. 

7.4.5. As medidas de associagao sao: $ T fGMrpP; coeficiente de contingencia P = 0,123; V de Cramer = 0,123. 

7.4.6. r s = - 0,19048, nao significante no nivel de 5%; p-valor = 0,6514. 

7.4.7. a) Os dois juizes que tern opinioes mais parecidas sao A e B. b) Os dois julzes que tern opinioes bem diferentes sao B e C. 


Coeficientes de correlagao segundo os julzes 


Juizes 

Coeficiente de correlagao 

p-valor 

A e B 

0,6121 

0,06 

A e C 

-0,0545 

0,881 

BeC 

-0,1758 

0,6272 


7.4.8. = 9,83 sem corregao, significante no nivel de 1%; p-valor = 0,0017; ^ 2 = 9,11 com corregao de Yates, significante no 
nivel de 1%; p-valor = 0,0026; coeficiente S = 0,1457. A associagao e pequena: o teste revelou-se significante devido ao 
tamanho da amostra. 

7.4.9. % 2 = 5,34, nao significante no nivel de 5%; p-valor = 0,2544; coeficiente de Cramer = 0,0943. 

7.4.10. % 2 = 16,86, significante no nivel de 5%; p-valor = 0,00981; coeficiente de Cramer = 0,16953. Existe associagao entre a 
denuncia confirmada e o perfil do denunciante. Veja que denuncias de familiares sao mais confiaveis. 


Denuncias confirmadas e nao confirmadas segundo o perfil do notificante 


Perfil do notificante 

Denuncia 


Total 

Percentual 


Nao confirmada 

Confirmada 



Familiares 

141 

50 

191 

26,20% 

Amigos e vizinhos 

140 

22 

162 

13,60% 

Anonimo 

84 

14 

98 

14,30% 

Desconhecido 

55 

6 

61 

9,80% 

Profissionais 

22 

3 

25 

12,00% 

A propria crianqia 

20 

2 

22 

9,10% 

Outros 

24 

4 

28 

14,30% 

Total 

486 

101 

587 

17,20% 


CAPITULO 8 


8.5.1. A sensibilidade (S), a especificidade (E) e a acuracia (A) do teste sao, respectivamente: 


S = — = 0,682 
176 


250 

E = -= 0,912 

274 


, 120 + 250 „ „„„ 

A =-= 0,822 

450 


8.5.2. O valor preditivo de teste positivo (VPP) e o valor preditivo de teste negativo (VPN) sao, respectivamente: 


VPP 

VPN 


120 

144 

250 

306 


0,833 

0,817 


8.5.3. 


1 

NNT =- 

Pt-Pc 


p t a proporgao de sucessos no grupo tratado = 99/100 = 0,99 


p c a proporgao de sucessos no grupo controle = 98/100 = 0,98 


1 

NNT = - 

Pt-Pc 


1 

0,99 - 0,98 


= 100 


8.5.4. A sensibilidade e 66,7%, a especificidade e 89,7%, o valor preditivo positivo e 51,7%, o valor preditivo negativo e 94,2% e 

a precisao e 86,5%. Os resultados do PSA total sao mais seguros do que os do exame fisico prostatico. 

8.5.5. Sensibilidade = 71/176 = 0,40; especificidade = 270/274 = 0,98; valor preditivo positivo = 71/75 = 0,95; valor preditivo 

negativo = 270/375 = 0,72; razao de verossimilhanga = 20. 

8.5.6. Vamos pressupor arbitrariamente que a populagao tenha 10.000 pessoas. So estamos tratando razoes, entao o tamanho da 

populagao e arbitrado. Como a prevalencia da doenga e de 5%, entao 0,05 x 10.000 = 500 pessoas tern a doenga. Logo, 
10.000 - 500 = 9.500 nao tern a doen^a. O numero de pessoas doentes que tiveram resultado positivo no teste e 0,99 x 
500 = 495. O numero de pessoas sem a doenga que tiveram resultado negativo no teste e 0,92 x 9.500 = 8.740. O valor 
preditivo do exame positivo e 39,4% e o valor preditivo do exame negativo e 99,9%. 

8.5.7. 


Calculos intermediaries 


Resultado do exame 


Doenta 


Total Valor preditivo 


Presente 


Ausente 


495 

VPP = -= 0,394 

1255 


Positivo 


495 


760 


1.255 






Negativo 

5 

8.740 

8.745 

VPN = = 0,999 

8745 

Total 

500 

9.500 

10.000 



495 

S = -= 0,99 

500 

= 0.92 

9500 




8.5.8. 1 0 = 0,450, I E =0,455; kappa = - 0,00917. Note que o Indice kappa e negativo, indicando muita discordancia entre os 
professores na avaliaqao dos alunos. 


Classificaqao dos alunos por dois professores 


Professor 1 


Professor 2 


Total 


A 

B 

C 


A 

8 

6 

0 

14 

B 

2 

1 

3 

6 

C 

0 

0 

0 

0 

Total 

10 

7 

3 

20 


8.5.9. Somente quando os examinadores concordam em todas as avalia^Ses. 

8.5.10. Somente quando, feito o exame para diagnostico, todas as pessoas doentes tern resultado positivo e todas as pessoas sem a 
doenqa em estudo tern resultado negativo. 


• • • 



Glossario 



Acaso: (estatrstica) 1. termo usado para descrever os resultados de um processo estocastico, isto 
e, um processo no qual a probabilidade de ocorrer qualquer evento e conhecida ou pode ser 
determinada. 2. diz-se do resultado da soma de um complexo de numerosas causas cujas 
atuagoes individuais desconhecemos. 3. ao acaso: nao significa, em estatrstica, a esmo, sem 
reflexao, inadvertidamente, mas o contrario: significa processo construrdo para que cada 
resultado possivel esteja associado a uma probabilidade conhecida. 

Acaso: (geral) 1. acontecimento incerto ou imprevisivel; casualidade, eventualidade. 2. fortuito. 
3. destino, fortuna, sorte. 2. ao acaso: a esmo, sem reflexao, inadvertidamente. 

Aleatorio: (estatrstica) 1. que acontece ao acaso, ou seja, diz-se da variavel que assume valores 
segundo uma determinada lei de probabilidades. Por exemplo, os resultados de um jogo de 
dados sao aleatorios. 2. quando e determinado por um complexo de numerosas causas 
somadas, mas cujas atuaqoes individuais desconhecemos. Por exemplo, erro aleatorio. 3. diz- 
se do processo construrdo para que cada resultado possivel esteja associado a uma 
probabilidade conhecida. Por exemplo, em um experimento, os tratamentos sao designados 
aos pacientes por processo aleatorio. 

Aloca^ao: processo de alocar ou designar um tratamento a uma unidade experimental. 

Amostra: qualquer conjunto cujas caracterrsticas ou propriedades sao estudadas com o objetivo 
de estende-las a outro conjunto, do qual o primeiro conjunto e considerado parte. 

Analise de variancia: tecnica estatrstica que subdivide a variabilidade total de um conjunto de 
dados em seus componentes. Pode estabelecer, por exemplo, que as medias de varios grupos 
sao estatisticamente diferentes. 

Apura^ao de dados: processo de tomar os dados brutos, registrados em fichas clinicas frsicas ou 
digitalizadas ou cadernos de laboratorio, e organiza-los de forma satisfatoria para posterior 
tabulaqao e analise. 

Banco de dados: coleqao ou arquivo de dados organizados de maneira especrfica e so acessado 
por pessoal com a necessaria competence, para proposito definido. 

Calculo do tamanho da amostra: calculo matematico, feito geralmente quando o ensaio e 
planejado, que estabelece o numero de pacientes que deve ser recrutado, a um dado nivel de 
significance e um dado poder de teste. 

Casual: o mesmo que aleatorio. 

Casualiza^ao: procedimento adotado nos ensaios clinicos casualizados; consiste em designar, 
por processo aleatorio - e nunca por escolha -, tratamentos pre-escolhidos aos participantes 



da pesquisa. Veja randomizagao. 

Casuistical registro pormenorizado de casos clinicos das doengas. 

Comparagao de tratamentos: qualquer comparagao que envolva dois ou mais tratamentos ou 
grupos. 

Comparagoes multiplas: referem-se ao fato de que dois ou mais tratamentos devem ser 
comparados, sempre em relagao a mesma variavel, em determinado momento do ensaio (em 
geral, no fim). 

Controle negativo: tratamento sem qualquer efeito farmacologico ou fisiologico, isto e, placebo 
ou pseudoprocedimento. Veja controle positivo. 

Controle positivo: normalmente o tratamento padrao, mas sempre um tratamento que envolve o 
uso de uma substantia farmacologicamente ativa. Veja controle negativo. 

Dado censurado: e o dado cujo valor esta alem de um limite conhecido, embora nao se saiba o 
valor exato do dado. 

Dado numerico: e expresso por numeros. Veja tambem dado quantitativo. 

Dados binarios: referem-se a uma variavel binaria, que so assume um de dois valores possrveis, 
0 ou 1. 

Dados brutos: 1. medidas e observagoes registradas em fichas clinicas ou cadernos de 
laboratorio, mas ainda nao organizadas para interpretagao. 2. listagens de dados obtidos em 
computador, mas na forma como foram coletados, antes de edigao, resumo e analise. 

Dados categorizados: sao aqueles distriburdos em categorias mutuamente exclusivas. Veja 
tambem dados qualitativos. 

Dados contmuos: referem-se a uma variavel contmua. Sao obtidos por mediqao. 

Dados discretos: referem-se a uma variavel discreta. Surgem de processos de contagem. 

Dados qualitativos: sao aqueles distriburdos em categorias mutuamente exclusivas. Veja 
tambem dados categorizados. 

Dados quantitativos: sao expressos por numeros. Veja tambem dado numerico. 

Dados: informaqao efetiva na forma de medidas, observaqoes ou estatrsticas, usada como base 
para argumentaqao. 

Delineamento: a parte do ensaio que especifica os tratamentos que serao avaliados, as unidades 



experimentais, a variavel em analise e o modo como os tratamentos serao designados as 
unidades experimentais. Veja tambem desenho. 

Desenho: o mesmo que delineamento. E usado porque tem sonoridade similar a design, o termo 
da lingua inglesa que traduz. No entanto, o termo delineamento e mais adequado. 

Discrepante (outlier): valor, leitura ou medida fora dos limites esperados e, por isso, colocado 
em duvida ou considerado erro. 

Distribui^ao casual dos tratamentos: processo de designar os tratamentos aos pacientes ao 
acaso usando, por exemplo, uma tabela de numeros aleatorios. Esse procedimento so e 
adotado em ensaios clinicos casualizados. Veja distribuiqao randomica dos tratamentos. 

Distribuiqao randomica dos tratamentos: o mesmo que distribuiqao casual dos tratamentos. 

Edi^ao de dados: processo de revisar dados com a finalidade de detectar deficiencias ou erros 
no modo como eles foram registrados ou colecionados. 

Efeito do tratamento: em ensaios clinicos, a diferenqa entre os resultados observados no grupo 
experimental e no grupo controle submetido a placebo. 

Efeito placebo: efeito produzido por placebo. 

Ensaio clinico controlado e casualizado - randomized controlled clinical trial (RCCT): 

ensaio clinico que envolve pelo menos um tratamento em teste e um tratamento controle, com 
recrutamento e seguimento simultaneos de todos os grupos, em que os tratamentos sao 
designados aos pacientes por processo aleatorio, de tal maneira que nem os pacientes nem os 
responsaveis pela seleqao e pelo tratamento desses pacientes possam influenciar a alocaqao de 
tratamentos e no qual as alocaqoes permanecem desconhecidas dos pacientes e do pessoal 
clinico ate o final. A alocaqao e conhecida dos pacientes e dos clinicos apenas por codigos, de 
preferencia numericos. 

Ensaio clinico: atividade de pesquisa em que um ou mais seres humanos sao alocados 
aleatoriamente a uma ou mais intervenqoes (que podem incluir placebo ou outro tipo de 
controle) para avaliar o efeito dessas intervenqoes em resultados biomedicos ou 
comportamentais relacionados a saude. Na maioria dos casos, a unidade experimental e o 
homem, mas pode ser um animal experimental. Veja unidade experimental. 

Ensaio: qualquer aqao experimental feita com a finalidade de obter dados para julgamento ou 
conclusao. O mesmo que experimento. 

Entrada de dados: processo de teclar os dados para armazenamento eletronico. 



Erro tipo I: consiste em rejeitar a hipotese da nulidade quando ela e verdadeira. 

Erro tipo II: consiste em aceitar a hipotese da nulidade quando ela e falsa. 

Estatistica de teste: formula ou algoritmo usado para um teste de significancia; o valor 
numerico calculado por essa formula ou esse algoritmo, para um teste especrfico de 
significancia, usando um conjunto de dados. 

Estudo: termo generico, usado para indicar uma grande variedade de atividades de pesquisas que 
envolvem coleqao, analise e interpretaqao de dados. Tambem usado como um sinonimo para 
ensaio clinico. 

Estudo comparativo: estudo que envolve dois ou mais grupos de pacientes para comparar e 
julgar a influencia de algum fator, procedimento ou alguma condiqao ou caracterrstica, 
presentes ou aplicados a um dos grupos, mas nao ao outro. Sinonimo de ensaio clinico se o 
estudo exige a comparaqao de tratamentos diferentes que envolvam pacientes tratados no 
mesmo perrodo de tempo. 

Estudo coorte: estudo que envolve a identificaqao de um grande numero de pessoas (coorte), 
algumas expostas a um fator causal suspeito, outras nao expostas a esse fator. Essas pessoas 
sao acompanhadas durante um perrodo de tempo relativamente longo para verificar se ocorreu 
ou nao um resultado ou uma condiqao de interesse, normalmente doenqa ou morte. Depois se 
comparam as proporqoes de ocorrencias (doenqa ou morte) nos dois grupos, isto e, nas 
pessoas expostas ao fator causal suspeito e nas nao expostas. Tambem chamado estudo 
prospectivo. 

Estudo de caso-controle: estudo que envolve a identificaqao de pessoas com uma doenqa ou 
condiqao de interesse (casos) e de um grupo comparavel de pessoas sem a doenqa ou condiqao 
de interesse (controles). Casos e controles sao comparados com respeito a algum atributo 
existente, passado ou de exposiqao que se acredita estar relacionado com a doenqa ou 
condiqao. Tambem chamado estudo retrospectivo. 

Estudo piloto: estudo preliminar projetado para indicar se um estudo maior e viavel. Tambem 
usado para estabelecer o tamanho da amostra. 

Estudo prospectivo: estudo no qual pessoas com uma caracterrstica ou um atributo especrficos 
sao identificadas e observadas por um perrodo de tempo para verificar se ocorreu ou nao um 
resultado ou uma condiqao de interesse, normalmente doenqa ou morte. 

Estudo retrospectivo: estudo no qual pessoas com uma caracterrstica ou uma doenqa sao 
identificadas e questionadas para saber se foram ou nao expostas a determinado fator. 

Experimento: trabalho cientrfico que se destina a verificar um fenomeno frsico; ensaio, 



tentativa. 


Experimentos multicentricos: experimentos conduzidos em dois ou mais centros, sempre com 
um protocolo comum, mas com uma administragao central e um centro unico para receber e 
processar os dados. 

Fator de risco: exposigao ambiental, caracterrstica pessoal ou evento que afete a probabilidade 
de contrair determinada doenga ou experimentar mudanga no estado de saude. Uma analise 
dos fatores de risco normalmente implica algum tipo de analise estatrstica para apontar ou 
identificar fatores de risco para determinada doenga ou condigao. 

Follow-up : seguimento do paciente. 

Grupo controle: em um ensaio clrnico, grupo de pacientes designados para o tratamento 
controle. Serve como base de comparagao para o grupo que recebe o tratamento em teste. 

Grupo experimental: em um ensaio clrnico, e o grupo de pacientes designados ao tratamento 
em teste. E contrastado com o grupo controle para chegar a uma conclusao sobre um fator, 
uma condigao ou um tratamento. 

Grupo tratado: o mesmo que grupo experimental. 

Hipotese alternativa: alternativa para a hipotese da nulidade, que postula haver diferenga entre 
as populagoes ou os grupos em comparagao, com relagao ao fator, a caracterrstica ou a 
condigao de interesse. Veja hipotese da nulidade. 

Hipotese da nulidade: hipotese que postula nao haver diferenga entre as populagoes ou os 
grupos em comparagao com relagao ao fator, a caracterrstica ou a condigao de interesse. Veja 
hipotese nula. 

Hipotese nula: tradugao corrente, mas equivocada, de null hypothesis, uma vez que nao e a 
hipotese que tern a qualidade de nula, mas sim o que ela postula (diferenga nula). Veja 
hipotese da nulidade. 

Intervengao: termo relacionado com a definigao de ensaio clrnico; e uma manipulagao do 
participante ou do ambiente do participante com a finalidade de modificar um ou mais 
processos biomedicos ou comportamentais relacionados a saude e/ou a desfechos. Exemplos 
incluem: drogas; dispositivos biologicos; procedimentos (p. ex., tecnicas cirurgicas); 
entrevistas face a face; estrategias para mudar o comportamento relacionado a saude (p. ex., 
dieta, terapia cognitiva, exercrcio, desenvolvimento de novos habitos); estrategias de 
tratamento; estrategias de prevengao; estrategias de diagnostico. Veja tratamento. 

Linha de base: dados coletados no inrcio de uma pesquisa para todos os participantes. Devem 



ser coletados dados demograficos, como idade e genero, alem das medidas especificas que 
serao estudadas na pesquisa e serao a base para medir mudanqas nas variaveis de interesse. 

Nao aleatoric: qualquer metodo que nao esteja em conformidade com a definiqao estatistica de 
acaso; termo usado pelos estatisticos para enfatizar a natureza de um processo fortuito ou 
sistematico. Veja tambem nao casual. 

Nao casual: o mesmo que nao aleatorio. 

Nivel de significancia: probabilidade de cometer erro tipo I, em um teste de hipoteses, com uma 
estatistica especificada. 

Niimero casual ou aleatorio: numero gerado por um processo aleatorio definido. 

Paciente: no contexto de pesquisa, o termo refere-se, sempre, ao paciente que participa, ou foi 
convidado para participar, da pesquisa. 

Parametro: 1. em estatistica, e a constante que, em uma expressao matematica, caracteriza uma 
populaqao ou um processo; seu valor e, em geral, desconhecido, mas pode ser estimado. 2. em 
medicina clrnica, e a variavel cuja medida e indicativa de uma quantidade ou funqao que nao 
pode ser determinada por metodos diretos. Por exemplo, a pressao sangumea e o ritmo do 
pulso sao parametros da funqao cardiovascular. 

Participante: o mesmo que sujeito, isto e, pode ser um paciente ou apenas voluntario que 
participa de um estudo. 

Placebo: agente farmacologicamente inativo dado a um paciente como substitutivo de um agente 
ativo para garantir que a resposta do paciente e explicada pela droga e nao pelo fato de se 
supor tratado. 

Poder do teste: probabilidade de rejeitar a hipotese da nulidade quando ela e falsa. 

Ponto de corte: ponto, em uma sucessao ordenada de valores, que separa esses valores em duas 
partes. 

Popula^ao: todos os pacientes que poderiam, eventualmente, ser recrutados para um estudo. 

Processo estocastico: diz-se do processo que depende, ou resulta, de uma variavel aleatoria. 

Protocolo: descriqao formal de todo o procedimento que sera usado em um projeto especrfico de 
pesquisa. 

Pseudoprocedimento: procedimento semelhante ao real, feito em alguns pacientes com a 
finalidade de tais pacientes (e, as vezes, o medico que faz a avaliaqao do ensaio) nao saberem 



se o procedimento adotado para esse paciente foi o real. 

p-valor: valor associado a uma estatrstica de teste que indica a probabilidade de um valor tao ou 
mais extremo que o observado ocorrer apenas por acaso em varias repetigoes de um 
experimento. 

Randomico ou randomizado: aleatorio. 

Randomizagao: veja casualizagao. 

Significancia estadstica: diz-se que houve significancia estatrstica quando a hipotese da 
nulidade foi rejeitada por um teste estatrstico. 

Software: programas de computagao, manuais relacionados e demais documentos necessarios 
para usar tais programas. 

Sujeito do estudo: termo generico que designa um indivrduo que participa de um estudo. A 
vantagem do termo, em relagao ao termo paciente, e o fato de evitar a conotagao de doenga - 
util nos casos em que sao estudadas pessoas sadias. Veja participante. 

Tamanho de amostra: 1. numero de unidades experimentais do ensaio, geralmente determinado 
atraves de um calculo, mas que tambem pode ser obtido por algum outro criterio, como, por 
exemplo, estudando o que e usual na area ou recrutando as unidades disponrveis. 2. numero de 
pacientes envolvidos em um estudo ou numero de pacientes que deverao ser envolvidos em 
um estudo. 

Tendencia: (estatrstica) 1. diferenga consistente, persistente, da estatrstica em relagao ao 
parametro que se quer estimar. Tambem dita vies ou vrcio, traduz a palavra inglesa bias. 2. 
evolugao da variavel em certos sentido e diregao, em geral, em fungao do tempo. Traduz a 
palavra inglesa trend. 

Tendencia: (geral) propensao, inclinagao, preferencia pessoal preconcebida que influencia a 
maneira pela qual uma medida, analise, avaliagao ou um procedimento e executado ou 
relatado. 

Teste bilateral: teste estatrstico que opoe, a hipotese da nulidade, a hipotese de que existe 
diferenga entre as populagoes ou os grupos em comparagao. 

Teste de significancia: o mesmo que teste estatrstico. 

Teste estatistico: diz-se que foi feito um teste estatrstico quando se usam dados observados e 
uma estatrstica de teste para tomar a decisao de rejeitar ou nao uma hipotese e se associa a 
essa decisao um p-valor. Veja teste de significancia. 



Teste unilateral: teste estatrstico que opoe, a hipotese da nulidade, a hipotese de que a diferenqa 
entre as populates ou os grupos em comparaqao esta apenas a direita ou apenas a esquerda 
da diferenqa nula. 

Tratamento alocado: tratamento administrado a um paciente como indicado no momento em 
que esse paciente decidiu participar do experimento. 

Tratamento controle: droga, dispositivo ou procedimento administrado em um ensaio clinico 
para servir como o padrao contra o qual os tratamentos em teste sao avaliados. O tratamento 
controle pode ser um placebo, um pseudoprocedimento, um tratamento padrao ou nenhum 
tratamento, dependendo do delineamento do estudo. 

Tratamento padrao: maneira amplamente aceita de tratar determinada doenqa ou condiqao. 

Tratamento: em estatrstica, regime, metodo ou procedimento testado em um ensaio clinico ou 
em um experimento, feito em qualquer area de conhecimento. 

Unidade: menor unidade em que o tratamento e aplicado e cuja resposta nao e afetada pelas 
demais unidades. Unidade basica para a coleta de dados e analises. Normalmente, refere-se a 
um paciente na experimentaqao com seres humanos, mas tambem pode ser material ou parte 
desse paciente (uma amostra de sangue, um dente) ou uma coleqao de indivrduos em outros 
contextos (p. ex., moradores de um domicrlio, uma ala de hospital). Sinonimo de unidade 
experimental em experimentaqao ou nos ensaios clinicos e de unidade observacional em 
estudos observacionais. 

Unidade experimental: veja unidade. 

Unidade observacional: veja unidade. 

Variavel: condiqao ou caracterrstica observada em cada paciente (p. ex., idade, historia de 
infarto do miocardio, nivel de glicose no sangue) que pode assumir valores diferentes e ser 
observada e registrada uma ou mais vezes ao longo da pesquisa. 

Variavel aleatoria: variavel que pode assumir qualquer um de um conjunto de valores 
diferentes, associados, cada um, a determinada probabilidade. 

Variavel binaria: variavel que so assume um de dois valores possrveis, 0 ou 1. Veja variavel 
dicotomica. 

Variavel continua: variavel que assume qualquer valor dentro de um intervalo especificado. 

Variavel dicotomica: o mesmo que variavel binaria. 

Variavel discreta: variavel que so assume determinados valores em um intervalo. Veja tambem 



variavel contmua. 


Wash-out : suspensao temporaria de medicagao para remover os efeitos residuais da droga em 
uso pelo paciente. 
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coordenados pelo Dr. Milton de Arruda Martins, MD.* Texto objetivo, pratico e em 
formato de alto padrao com recursos faceis de usar, incluindo fluxogramas e 
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A 13 a edi^ao do Guyton & Hall Tratado de Fisiologia Medica mantem a longa 
tradi^ao deste best-seller como o melhor livro-texto de Fisiologia Medica do mundo. 
Diferentemente de outros livros, este guia claro e de facil compreensao tem voz 
autoral unica e consistente e ressalta o conteudo mais relevante para os estudantes 
clinicos e pre-clinicos. O texto detalhado, porem esclarecedor, e complementado por 
ilustra^oes didaticas que resumem conceitos-chave em fisiologia e fisiopatologia. • 

O texto com fonte maior enfatiza a informa^ao essencial sobre como o corpo deve 
manter a homeostasia de modo a permanecer saudavel, ao mesmo tempo em que as 
informa^oes de apoio e os exemplos sao detalhados com tamanho de fonte menor e 
destacados em bias. • As figuras e tabelas de resumo transmitem de maneira 
facilitada os processos chave apresentados no texto. • Contem a nova tabela de 
referenda rapida de valores laboratoriais padrao no final do livro. • Acrescimo do 
numero de figuras, correlates clinicas e mecanismos moleculares e celulares 
importantes para a medicina clinica. • Inclui o conteudo online em portugues do 
Student Consult, que oferece uma experiencia digital aprimorada: banco de 
imagens, referencias, perguntas e respostas e animates. Junto com a nova edigao 
da consagrada referenda mundial da fisiologia, Guyton & Hall, voce tambem tem 
acesso a forma mais inovadora, simples, visual e objetiva de aprender fisiologia, o 
Homem Virtual, a maneira inteligente de estudar fisiologia em 3D. 
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Domine o conteudo da ginecologia e obstetricia e passe nas provas da sociedade 
com o novo tratado da Febrasgo, um texto de referenda para esta importante area. 
Chancela Febrasgo Referenda para as provas da especialidade, certifica^ao e 
recertificagao. 
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